首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
一种基因本体术语间的语义相似度计算方法   总被引:2,自引:0,他引:2       下载免费PDF全文
计算基因本体中的术语的语义相似度是基因本体的一个重要应用。基于信息量和基于距离的语义相似度计算方法都只从各自的角度计算术语间语义相似度。提出了基于基因本体中术语所在有向无环图的计算方法。该方法既考虑了术语的祖先对其的信息量的影响,又考虑了术语所在的位置以及术语间的语义联系类型。实验结果表明该方法有较高的准确度。  相似文献   

2.
基于基因本体的语义相似度研究   总被引:3,自引:0,他引:3       下载免费PDF全文
魏韡  向阳  陈千 《计算机工程》2010,36(20):209-210
针对基因本体的有向无环图结构,提出一种新的计算基因本体中术语间语义相似度的方法。该方法通过计算2个术语的公共祖先及符合条件的不相交祖先,得到不相交祖先的信息量平均值和2个术语的信息量平均值,并将2个平均值的比值作为2个术语的语义相似度。实验结果证明该方法准确度较高。  相似文献   

3.
刘建明  史一民  张俊  陈存衡 《计算机工程》2013,39(3):223-228,235
在资源描述框架(RDF)图的语义相似性度量过程中,结构相似性和语义相似性计算不精确。针对该问题,提出结构语义(SAS)方法。结合改进的基于网络距离模型的语义距离公式、基于信息量模型的权重度量机制,计算概念节点的语义相似度,完善RDF图语义相似度算法,分析结构、深度和密度对RDF图语义相似性度量的影响。设计并实现原型系统,实验结果表明,该方法可有效保证RDF图的语义相似度与实际相符。  相似文献   

4.
一种改进的概念语义相似度计算方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对当前概念相似度计算的片面性和不完善性等不足,提出一种改进的基于语义距离的概念间语义相似度计算方法。从有向边包含的信息量、有向边的类型以及概念密度3个方面对语义距离进行扩展,将语义距离转换成语义相似度,通过引入不对称因子,使最终概念语义相似度计算更加精确。将该方法与基于信息量方法、基于距离方法及人的主观判断结果进行比较,验证了该方法的可行性和有效性。  相似文献   

5.
为了能够正确地理解医疗概念和精确地分析临床记录,提出了一种基于概念信息量的方法来衡量概念之间的语义相似度.引进了计算概念信息量的算法,从医疗本体的分类知识中来计算概念的信息量.介绍和分析了常用的语义相似度算法,根据概念的信息量来重定义这些语义相似度算法,产生新的基于概念信息量的语义相似度算法.通过使用一个医疗术语的评估标准和一个标准的医疗本体来评估和比较这些算法.实验结果表明,相比常用的语义相似度算法,重定义后的算法有效地改善了概念相似性评估的准确性.  相似文献   

6.
一种本体概念的语义相似度计算方法   总被引:1,自引:0,他引:1  
概念语义相似度已广泛应用于 Web 服务发现、本体映射等领域, 但现有的概念语义相似度计算方法对概念间语义相似程度的区分不够细致. 本文从本体结构出发, 首先提出了自底向上的本体概念出现概率计算方法, 并在此基础上改进了基于节点信息量的概念语义相似性度量方法; 然后又设计了基于边计算的本体概念语义相似度计算方法; 最后对上述两种方法线性加权, 提出了一种加权的本体概念语义相似度计算方法. 实验结果表明该方法能进一步正确区分本体中父子概念及兄弟概念间的相似程度.  相似文献   

7.
术语是由一个到多个单词按照某种语义角色组合而成的,传统的基于统计的相似度计算方法,将术语看作一个基本单元来进行计算,忽略了术语内部的语义角色,且对于上下文信息不丰富的术语,无法利用统计的方法取得理想的效果;基于语义资源的相似度计算方法,所涵盖的词语有限,因此不包含在语义资源中的术语便无法计算相似度。针对这些问题,该文针对专利提出了基于语义角色的术语相似度计算方法,该方法弥补了传统方法的不足。该文对术语内部的单词进行语义角色标注,通过共享最近邻方法计算单词的相似度,然后根据不同的语义角色,利用单词相似度来计算术语相似度。实验表明,该方法与传统方法相比,取得了较好的效果。  相似文献   

8.
语义相似度的计算是自然语言处理中的重要研究内容,在过去几十年的研究工作中,已有大量的语义相似度计算方法被提出并广泛应用于语义消歧、文本聚类等领域中。基于WordNet本体,改进了信息量IC计算模型,进而提出了两种混合式的语义相似度的计算方法。实验结果表明,由于同时考虑了概念节点在WordNet中的最短路径距离和IC语义距离,所提方法优于已有方法,其计算结果更加接近人类的主观判断。  相似文献   

9.
该文提出基于Word Embedding的歧义词多个义项语义表示方法,实现基于知识库的无监督字母缩略术语消歧。方法分两步聚类,首先采用显著相似聚类获得高置信度类簇,构造带有语义标签的文档集作为训练数据。利用该数据训练多份Word Embedding模型,以余弦相似度均值表示两个词之间的语义关系。在第二步聚类时,提出使用特征词扩展和语义线性加权来提高歧义分辨能力,提高消歧性能。该方法根据语义相似度扩展待消歧文档的特征词集合,挖掘聚类文档中缺失的语义信息,并使用语义相似度对特征词权重进行线性加权。针对25个多义缩略术语的消歧实验显示,特征词扩展使系统F值提高约4%,使用语义线性加权后F值再提高约2%,达到89.40%。  相似文献   

10.
张帆  钟金宏  黄玲 《计算机工程》2010,36(23):66-68
在领域本体中,概念间往往存在多条路径,现有的基于语义距离的方法只考虑最短距离的路径,不能完全体现出概念间的相似度。基于此,提出一种基于加权语义距离的概念相似度计算方法。该方法搜索出两概念间的所有路径,以所有路径的加权平均距离代替最短距离来计算相似度,并综合考虑节点深度、公共父节点对相似度的影响。实验表明,该方法计算出的概念相似度能够更准确地体现出概念间的相似程度。  相似文献   

11.
王艺  王英 《计算机工程》2021,47(10):67-74
语义图概要的目的是提取语义图的关键信息,形成原数据集的概要模型以解决大规模语义图的理解、查询、应用难题。为提升现有语义图概要方法效率,提出一种基于本体分割的概要方法。通过本体分割算法对语义图进行分割生成扩展子图。采用形式概念分析对每个扩展子图生成元素的偏序格(又称特征集格)。在此基础上,由所有子图的特征集格形成了原语义图的概要。在关联开放数据集和Berlin SPARQL Benchmark数据集上的实验结果表明,该方法具有较好的可扩展性,有效提高了概要方法的效率。  相似文献   

12.

Text summarization presents several challenges such as considering semantic relationships among words, dealing with redundancy and information diversity issues. Seeking to overcome these problems, we propose in this paper a new graph-based Arabic summarization system that combines statistical and semantic analysis. The proposed approach utilizes ontology hierarchical structure and relations to provide a more accurate similarity measurement between terms in order to improve the quality of the summary. The proposed method is based on a two-dimensional graph model that makes uses statistical and semantic similarities. The statistical similarity is based on the content overlap between two sentences, while the semantic similarity is computed using the semantic information extracted from a lexical database whose use enables our system to apply reasoning by measuring semantic distance between real human concepts. The weighted ranking algorithm PageRank is performed on the graph to produce significant score for all document sentences. The score of each sentence is performed by adding other statistical features. In addition, we address redundancy and information diversity issues by using an adapted version of Maximal Marginal Relevance method. Experimental results on EASC and our own datasets showed the effectiveness of our proposed approach over existing summarization systems.

  相似文献   

13.
提出了一种计算英文句子间相似度的方法。基于句子所传递的信息——其描述的对象、描述对象的属性和动作,首先将待比较的两个句子进行语块分析,并从中提取以上三个方面的信息;然后通过语义向量的方法,分别计算两个句子在这三个方面的相似度;最后将它们结合起来作为两个句子的整体相似度,并通过训练得到最优的结合参数。实验表明,提出的方法与目前计算句子间相似度的方法相比更加符合人工判断句子间相似度的过程,表现出更高的准确性,达到了较高的性能指标。  相似文献   

14.
王宇  王芳 《计算机应用研究》2020,37(6):1769-1773
社区问答系统中充斥着大量的噪声,给用户检索信息造成麻烦,以往的问句检索模型大多集中在词语层面。针对以上问题构建句子层面的问句检索模型。新模型基于概念层次网络(hierarchincal network of concept,HNC)理论当中的句类知识,从句子的语用、语法和语义三个层面计算问句间相似度。通过问句分类算法确定查询问句和候选问句的问句类别,得到问句间的语用相似度,利用句类表达式的结构和语义块组成分别计算问句间的语法及语义相似度。在真实数据集上的实验表明,基于HNC句类的新模型提高了问句检索结果的准确性。  相似文献   

15.
现有的异质网络嵌入方法不仅忽略了网络中的异质边及其对节点嵌入的不同影响,还未考虑到网络结构与节点属性的融合。为此提出了一种融合属性信息的异质网络嵌入方法(SHANE)。将序列到序列(seq2seq)模型应用到依据边类型划分的子图中,无缝融合节点的结构信息和属性信息,同时捕捉节点的高阶语义信息。实验表明,SHANE在两个不同类型的数据集中进行链接预测任务,可以取得相对显著的效果。  相似文献   

16.
传统的邻近性检索模型同等地看待所有查询词,不加区分地考虑所有查询词的邻近性,造成“平行概念效应”,影响邻近性检索方法的性能。文中提出一种查询词相似度加权的邻近性检索方法。该方法根据查询词之间的语义相似度对查询词邻近性统计量加权,可进一步推断用户的实际信息需求,挖掘查询中蕴含的更深层次的信息。实验结果表明,在短查询较多的应用环境下,文中方法可较显著提升传统邻近性检索模型的性能,有效规避查询词邻近性的平行概念效应。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号