首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
王璐  张仰森  吴林 《计算机工程》2012,38(20):109-112
为更全面准确地从字词搭配中获取语义搭配信息,提出一种新的语义搭配知识提取模型和知识库的表示方法.利用特殊度度量词语搭配的相关程度,在此基础上,基于知网的语义信息,实现从42万条记录的词语搭配中定量地抽取语义搭配信息.实验结果表明,该方法的语义搭配准确率为92.1%,且较大地扩充了字词搭配的规模.  相似文献   

2.
吴林  张仰森 《计算机工程》2012,38(20):21-25
以往的中文文本查错研究主要针对字词错误,对句法、语义的错误推理研究不够.为此,利用统计模型和大规模人民日报语料库构建并扩充查错知识库,针对文本中字词、语法以及语义3个层次的错误,提出相应的多层级查错推理模型.设计并实现3个层级的文本查错算法,构建自动查错系统进行综合查错.实验结果表明,该系统查错性能较优,召回率达到85.62%.  相似文献   

3.
汉语缺乏词形变化,语法信息需通过词语搭配关系获得,且在生活中词语通常在搭配中发挥交际作用。因此无论是在语言学本体,还是在自然语言处理的各项任务中,词语搭配知识都尤为重要。各种搭配中,动宾搭配能够反映句子轮廓,并在数量和多样性方面具有优势地位,故该文聚焦于构建现代汉语动宾搭配知识库,以期为自然语言处理提供基础知识,同时也为语言本体研究、语言教学等提供大量实例。该文首先从语言本体的角度出发,总结了动宾搭配的知识体系,并根据该体系制定相应形式化检索式140个,从BCC语料库中抽取动宾搭配知识,并对抽取结果进行了初步消歧,最终获得动宾搭配300万对,形成动宾搭配知识库。  相似文献   

4.
基于维基百科的语义知识库及其构建方法研究*   总被引:1,自引:0,他引:1  
维基百科(Wikipedia)是规模最大的在线网络百科全书之一,采用群体在线合作编辑的Wiki机制,具有质量高、覆盖广、实时演化和半结构化等特点,是用来构建语义知识库的优质语料来源。分析了维基百科语料库的基本情况,综述了目前基于维基百科所构建的多种语义知识库及其概念抽取和关系抽取方法,讨论了各类方法的优缺点、开放问题和可能的研究方向。  相似文献   

5.
知识库系统中语义网知识的表示   总被引:7,自引:0,他引:7  
基于对知识库系统中知识表示的理解,提出了在语义网环境下知识库系统的建立和相应的知识表示,并将此扩展到语义网中整个的知识表示系统。  相似文献   

6.
汉语框架语义知识库概述   总被引:1,自引:0,他引:1  
介绍了汉语框架语义知识库(Chinese FrameNet,简称CFN)的语义描述体系。CFN是一个以Fillmore的框架语义学为理论基础、以伯克利FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义知识库,它包括框架库、句子库和词汇库三部分。经过三年的努力,目前已取得了阶段性成果。CFN构建工程量大,难度很高,目前课题组只能在有限目标下开展工作,但是,已经探索了一条可行的技术路径,为实现语义Web中的语义知识共享以及智能化、个性化的Web服务提供了基础资源。  相似文献   

7.
ICTS 是关于汉语知识的 智能型计耳机辅助教学系统。本文 首先给出了ICTS的总体结构和各主 妥部分的 设计思想, 提出了基于多知识源的推理机制; 接着阐述了Hypertext技术在ICTS构造中的应用; 最后对ICTS 的实现作出了总结。  相似文献   

8.
互联网已成为全球最大的知识资源库,然而要从互联网上获取有用的知识却非常困难。本文提出一种基于互联网的词汇语义知识库构建框架,分为三个大模块:网页文本自动获取、知识获取和知识应用。该框架能实现在线获取海量网页文本,提取中文组合词并对其进行词标注,获取同义词集和词间语义关系,进而实现语义计算。词汇语义知识库的构建将为大量的知识应用提供基础。  相似文献   

9.
设计并实现一个词汇知识获取及语义计算平台VKASCP,以及自然语言处理所需要的基础功能模块。系统主要功能模块包括合成词识别、合成词词性标注及分词修正、主题词提取、词汇语义计算,以及基于主题词集的自动文摘和文本相似度计算。VKASCP融文本语料库、词汇知识库于一体,为词汇知识获取及语义计算提供了一个良好的研究平台,并为今后构建词汇语义知识库打下了坚实的基础。  相似文献   

10.
动词语义角色一直是国内外语言学界研究的重点和难点。在自然语言处理领域,相关的语言资源也在逐步构建。对于汉语而言,国内大部分工作集中在语义角色标注上。该文创造性地提出了一种三元搭配的动词语义角色知识表征形式,并在前人研究的基础上,提出了一套语义角色分类体系。在该体系指导下,对汉语动词进行了穷尽式的语义角色认定及相关知识加工,以构建汉语动词语义角色知识库。截至目前,该工程考察了5 260个动词,加工了语义角色及引导词的动词数量为2 685个,加工认定语义角色4 307个。  相似文献   

11.
知识库是集团企业云制造平台中知识服务的重要基础,知识库的质量直接决定着知识服务的质量。目前单一分散的知识库不能提供统一的知识资源全局视图,不利于知识资源的共享。多知识库整合技术已经成为该领域的研究热点之一。提出一种基于知识库分割的多知识库整合方法,采用基于蚁群聚类的分割策略,将知识库有效划分为知识块集。在知识块间利用语义概念映射生成知识块间映射图,从而实现多知识库整合。通过对算法的时间复杂度进行分析,表明该方法在时间复杂度方面要优于基于最小概念集的多知识库整合方法;实验结果也表明该方法在运行性能方面明显优于已有的方法。  相似文献   

12.
为了产生语义Web中的元数据,需要提取Web文档中的语义信息。面对海量的Web文档,自动语义标注相对人工和半自动的语义标注是可行的方法。提出的基于本体知识库的自动语义标注方法,旨在提高标注的质量。为识别出文档中的候选命名实体,设计了语义词典的逻辑结构,论述了以实体之间语义关联路径计算语义距离的方法。语义标注中的复杂问题是语义消歧,提出了基于最短路径的语义消歧方法和基于n-gram的语义消歧方法。采用这种方法对文档进行语义标注,将标注结果持久化为语义索引,为实现语义信息检索提供基础。针对构建的测试数据集,进行的标注实验表明该方法能够依据本体知识库,有效地对Web文档进行自动语义标注。  相似文献   

13.
讲述了目前语义知识库的一些存储方案,针对由Lehigh大学提出的语义Web数据测试集LUBM,选取了其提供的14种查询中的3个做了相应实验,分析比较了知识库的各种不同存储方案之间对于查询相应时间和存储空间的差别。实验结果表明,与其他存储方案相比,采用TDB存储方式能大幅度提高用户检索的效率,并且降低了存储空间。  相似文献   

14.
针对为检索服务的语义知识库存在的内容不全面和不准确的问题,提出一种基于维基百科的软件工程领域概念语义知识库的构建方法;首先,以SWEBOK V3概念为标准,从维基百科提取概念的解释文本,并抽取其关键词表示概念的语义;其次,通过概念在维基百科中的层次关系、概念与其它概念解释文本关键词之间的链接关系、不同概念解释文本关键词之间的链接关系构建概念语义知识库;接着, LDA主题模型分别和TF-IDF算法、TextRank算法相结合的两种方法抽取关键词;最后,对构建好的概念语义知识库用随机游走算法计算概念间的语义相似度;将实验结果与人工标注结果对比发现,本方法构建的语义知识库语义相似度准确率能够达到84%以上;充分验证了所提方法的有效性。  相似文献   

15.
基于知识树的领域知识组织和应用   总被引:1,自引:0,他引:1  
在分析已有知识表示方法优缺点的基础上,提出一种高效的知识表达模型——概念知识树。概念知识树模型不仅结构性好、表达能力强,而且在应用中具有良好的适应性和延展性,现主要应用于信息检索和自然语言理解领域。以旅游领域为背景,用概念知识树作为表达模型建立相应的领域知识体系,并在此基础之上实现了一个旅游智能分析系统。该系统可在对用户需求(自然语言)进行一定程度语义理解的基础上,根据所建立的知识体系自动进行语义匹配,最终返回满足用户需要以及相关的旅游路线信息。  相似文献   

16.
研究利用本体进行构建某一特定领域的知识库,这项技术被人们广泛地用于解决异构环境互操作、系统工程,以及通信等领域中的知识获取、知识共享、知识重用和系统集成等。在已有研究的基础上,将电动工具工业设计作为本体,归纳总结了某一具体领域本体知识库的构建方法,有助于前期调研人员更好地搜索准确有用的资料,也有助于设计人员高效并高质量地进行新产品开发,用途广阔。  相似文献   

17.
中文网络文本的语义信息处理研究综述   总被引:1,自引:0,他引:1  
从学术价值和应用价值两方面分析了将计算机学科与语言学学科的研究方法相结合对于研究网络文本的意义,分别从分析网络文本的特性、网络词汇的演化规律以及构建网络文本语言知识库、开发平台和支持工具等方面对该领域中的研究现状与相关工作予以描述与分析,试图明晰面向中文网络文本的语义信息处理的研究内容和路线,为相关研究的进一步开展奠定基础.  相似文献   

18.
为了在检索过程中全面表达用户查询意图,提出了基于领域本体知识库的语义查询扩展方法。该方法借助领域本体推理出的知识,使检索系统从语义层面理解用户查询语句,并通过语义相似度来控制扩展词的规模,避免了查询过度扩展,使得新构造的查询能更准确地描述用户的检索需求,提高了检索的有效性。原型系统的实验结果表明,该方法较传统的关键字匹配法和LAC方法有明显的优势,在保障查全率的基础上,可极大地提高检索准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号