首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
中文概念词典的结构   总被引:26,自引:5,他引:26  
中文概念词典(Chinese Concept Dictionary ,简称CCD)是北京大学计算语言学研究所开发的与WordNet兼容的汉语语义词典。本文着重描述了CCD的结构:CCD中的“概念”用同义词的集合定义,CCD的主关系——概念之间的继承关系(即上下位关系)和一些附加关系使得CCD形成一个概念网络,其上的演绎规则是严格形式化了的,可应用于中文的语义分析。  相似文献   

2.
基于改进潜在语义分析的跨语言检索   总被引:1,自引:0,他引:1  
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的跨语言检索,取得了较好的实验效果。  相似文献   

3.
基于朴素贝叶斯模型的单词语义相似度度量   总被引:1,自引:0,他引:1  
单词语义相似度度量是自然语言处理领域的经典和热点问题.通过结合朴素贝叶斯模型和知识库,提出一个新颖的度量单词语义相似度度量途径.首先借助通用本体 WordNet 获取属性变量,然后使用统计和分段线性插值生成条件概率分布列,继而通过贝叶斯推理实现信息融合获得后验概率,并在此基础上量化单词语义相似度.主要贡献是定义了单词对距离和深度,并将朴素贝叶斯模型用于单词语义相似度度量.在基准数据集 R&G(65)上,对比算法评判结果与人类评判结果的相关度,采用5折交叉验证对算法进行分析,样本 Pearson 相关度达到0.912,比当前最优方法高出0.4%,比经典算法高出7%~13%;Spearman 相关度达到0.873,比经典算法高出10%~20%;且算法的运行效率和经典算法相当.实验结果显示将朴素贝叶斯模型和知识库相结合解决单词语义相似度问题是合理有效的.  相似文献   

4.
自然语言语义分析是自然语言处理技术走向深层应用的瓶颈。当前在概念、关系层次上的语义分析方法主要有两种:基于统计的特征向量抽取方法和基于语义词典(WordNet、HowNet等)的语义相似度计算方法。对于具体应用这两种方法都具有较大不足,前者由于统计模型的关系只适用于段落、篇章或多文档等粗粒度的语义分析,而不适合在句子词汇一级的应用;后者能方便处理实体概念之间的各种关系,但是如果想正确处理真实文本中的复杂修饰关系如概念与事件、概念与概念修饰、事件与事件修饰等关系,还需对语义词典和计算方法做进一步的扩展。提出了按照真实文本语句中词语之间修饰关系建立知识库,并设计了根据该知识库中已有修饰关系计算未知关系的算法;提出了可以依照修饰关系建立自然语言构句法的思路并给出了相关算法;最后给出了在语义分析系统上的实验,结果证明该方法是有效的。  相似文献   

5.
针对汉语文本语义搭配错误,在对《现代汉语语义信息词典》(以下简称《语义词典》)及《知网》相关属性的研究基础上,提出了基于多知识源的语义搭配知识库的构建方法,并设计出了面向汉语文本语义查错的三层语义搭配知识库结构.在此基础上,设计并实现了一个汉语文本自动查错算法.实验结果表明,基于上述方法所设计的语义搭配知识库,可以大大提高汉语文本语义查错算法错误查找的召回率,对于语义查错的研究具有一定的借鉴作用.  相似文献   

6.
给出了一个新的用于计算WordNet中概念的语义相似度的IC(信息内容)模型。该模型以WordNet的is_a关系为基础,只通过WordNet本身结构就可求出WordNet中每个概念的IC值,而不需要其他语料库的参与。该模型不仅考虑了每个概念所包含的子节点的个数,而且将该概念所处WordNet分类树中的深度引入到模型当中,使得概念的IC值更为精确。实验结果显示将该模型代入到多个相似度算法当中,可以明显提高这些算法的性能。  相似文献   

7.
文章详细叙述了语义分析在汉语生成中的应用,重点构造了语义结构文法,并以此为基础提出了基于XML的汉语生成方法,该方法以XML树传递内部信息,使用XSL构造汉语句子生成格和实现XML树之间的转换。开发了一个基于XML的汉语生成模型。此模型具有一定的通用性,依托不同领域的知识库仅要对其作少量修改便能在该领域工作。  相似文献   

8.
构建了一个遥感信息领域本体,基于领域本体和WordNet词典对遥感信息服务进行语义扩展,提出了一种基于本体概念相似度的遥感信息服务匹配方法,并对Leacock和Chodorow语义相似度计算模型进行改进。实验结果表明,该改进模型比距离模型和信息量模型都有提高,基于本体概念相似度的遥感信息服务匹配方法的查全率和查准率都能达到70%以上,较关键字匹配方法有显著提高。  相似文献   

9.
基于Jena的WordNet检索技术研究   总被引:1,自引:0,他引:1  
用Jena从模型的角度对WordNet进行检索研究,从而达到对语义知识库的复用和对语义知识库的二次开发。  相似文献   

10.
赵小虎  赵成龙 《计算机应用》2020,40(7):1873-1878
知识库问答(KBQA)任务主要目的在于精确地将自然语言问题和知识库(KB)中的三元组进行匹配。传统的KBQA方法通常专注于实体识别和谓语匹配,实体识别的错误会导致错误传播从而无法得到正确的答案。针对上述问题提出一种端到端的解决方案直接匹配问题和三元组,该系统主要包含候选三元组生成和候选三元组排序两个部分来实现精确问答。首先通过BM25算法计算问题和知识库中三元组的相关性生成候选三元组;然后通过多特征语义匹配模型(MFSMM)进行三元组的排序,即用MFSMM分别通过双向长短时记忆网络(Bi-LSTM)和卷积神经网络(CNN)实现语义相似度和字符相似度的计算,并通过融合来对三元组进行排序。该系统在NLPCC-ICCPOL 2016 KBQA数据集上的平均F1为80.35%,接近了现有最好的表现。  相似文献   

11.
基于加权的本体相似度计算方法   总被引:1,自引:0,他引:1  
为优化基于本体的语义推理效果,提出了对本体中概念结点赋予权重的相似度计算方法.通过定义本体树中深度因子和密度因子,以解决本体中概念深度与密度对相似度计算的影响.利用Jena API、Lucene等开源工具包,提出了查询扩展方法.实验结果表明,提出的基于加权语义相似度计算模型与传统的计算法方法以及主观判断的方法相比,提高了相似度计算的准确性,效率有明显提高.  相似文献   

12.
语义网、语义网格和语义网络   总被引:9,自引:0,他引:9  
语义网、语义网格和语义网络是三个容易混淆的概念,语义网是对WWW的延伸,其目标是使得Web上的信息具有计算机可以理解的语义,并为人们提供各种智能服务;语义网格是语义Web和网格相结合产生的新的研究领域;语义网络是知识的一种图解表示,它由节点和弧线或链线组成.通过对三者的概念、特征、应用等方面进行介绍从而说明了三者的联系以及不同,并说明了今后对三者的研究方向和重点问题.  相似文献   

13.
基于语义网的语义相似度算法改进   总被引:20,自引:4,他引:16  
传统的语义相似度算法采用纯语义距离或以本体库的统计特性为基础。论文的改进算法把这两者结合起来,互为约束,并且加入了“深度”和“密度”对语义距离的辅助影响。改变语义相关性的比重只需调节算法中的一个参数。最后通过WordNet构造的局部语义树,比较了各算法的有效性。  相似文献   

14.
传统的基于关键字的信息检索技术不能满足人们对信息查询的需求,语义网技术是解决这一问题最有前景的方法。本文设计与开发一个基于出版物领域本体的语义查询与推理系统,该系统构建了出版物领域本体,并构造该领域本体的查询语句和推理规则,给出语义查询和推理的结果,并对结果进行测试。结果验证了系统对语义查询和推理的可行性和有效性。   相似文献   

15.
动结式形式简洁,语义关系却比较复杂,是语言学界广泛关注的重要研究课题,也是汉语自然语言分析处理中的一个重要句型。本文旨在从计算语言学的角度对其中一个大类即"V+ADJ"类型进行梳理研究,整理归纳了"V+ADJ"动结式的范畴模式,然后重点讨论了它们的表层语义结构,并将其表达为相应的语义网络,给出了分析的语义规则式。此外,还对动结式的歧义问题作了初步探讨。  相似文献   

16.
现在信息检索的应用已经越来越广泛,但要在具体领域中做到准确搜索,仍然是一件比较难的事情。该文提出一种基于概念语义树的语义相似度计算方法,综合考虑了概念的语义关系、层次结构和继承关系等因素,尽可能的地提高在特定领域中的信息检索效率,并最后通过实验,验证了该方法的可行性。  相似文献   

17.
由于图像数据中普遍存在的“语义鸿沟”问题,传统的基于内容的图像检索技术对于数字图书馆中的图像检索往往力不从心。而图像标注能有效地弥补语义的缺失。文中分析了图像语义标注的现状以及存在的问题,提出了基于语义分类的文物语义标注方法。算法首先通过构建一个Bayes语义分类器对待标注图像进行语义分类,进而通过在语义类内部建立基于统计的标注模型,实现了图像的语义标注。在针对文物图像进行标注的实验中,该方法获得了较好的标注准确率和效率。  相似文献   

18.
查询扩展技术是在原有用户查询的基础上加入语义相关的新词,组成语义更准确的查询条件。文中对查询扩展算法中扩展词加权方法进行改进,提出一种基于初始用户查询意欲和词与词间语义关联性给扩展词加权的方法。根据此算法得到的扩展词权值不仅反映了该扩展词和原关键词间的关联性,还反映出该扩展词和查询关键词集合中所有元素的关联性。因此,可将基于语义树的查询扩展问题转换为扩展词权值wijs,o,p的计算,如何计算出权值wijs,o,p是文中的核心。实验证明,该算法提高了检索的查准率。  相似文献   

19.
语义理解是自然语言理解的一项关键任务,传统上采用以语法为中心的词法和句法分析等技术来解析句义。该文提出了一种以语义块分析藏文句义的新方法,其中藏文语义块识别通过采用Bi-LSTM和ID-CNN 两种神经网络构架对该任务进行建模和对比分析。经实验,上述的两种模型在测试数据集上取得了良好的性能表现, F1值平均分别为89%和92%。这种语义块分析和识别技术能够较好地替代词义消歧和语义角色标注等工作。  相似文献   

20.
自然语言词汇的语义相关度的计算需要获取大量的背景知识,而维基百科是当前规模最大的百科全书,其不仅是一个规模巨大的语料库,而且还是一个包含了大量人类背景知识和语义关系的知识库,研究表明,其是进行语义计算的理想资源,本文提出了一种将维基百科的链接结构和分类体系相结合计算中文词汇语义相关度的算法,算法只利用了维基百科的链接结构和分类体系,无需进行复杂的文本处理,计算所需的开销较小.在多个人工评测的数据集上的实验结果显示,获得了比单独使用链接结构或分类体系的算法更好的效果,在最好的情况下,Spearman相关系数提高了30.96%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号