首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
通过对两种传统的语义相似度算法学习及数据对比,看到了不足之处。面对庞大的信息资源,大家对资源的理解是不同的,相同或相近的资源标注就会有所不同。用传统的语义相似度算法去标注资源就会出现理解上的差异问题。  相似文献   

2.
语义相似度计算的应用范围广泛,从心理学、语言学、认知科学到人工智能都有其应用.提出了仅依赖于知网(HowNet)的信息量计算来估计两个词汇间的语义相似度.经实验证明,相比于传统的基于词网(WordNet)和大型语料库的计算信息量来估计语义相似度的算法,本文的算法更容易计算,并更接近于人工的语义相似度判断.  相似文献   

3.
董苑  钱丽萍 《计算机科学》2017,44(Z11):422-427
为了克服传统的文本相似算法缺乏综合考虑语义理解和词语出现频率的缺点,在基于语义词典的词语相似度计算的基础上,提出了一种基于语义词典和词频信息的文本相似度(TSSDWFI)算法。通过计算两文本词语间的扩展相似度,找出文本词语间最大的相似度配对,从而计算出文本间的相似度。这种相似度计算方法利用语义词典,既考虑了不同文本间词语的相似度关系,又考虑了词语在各自文本中的词频高低。实验结果表明,与传统的语义算法和基于空间向量的文本相似度计算方法相比,TSSDWFI算法计算的文本相似度的准确度有了进一步提高。  相似文献   

4.
本体语义相似度自适应综合加权算法研究   总被引:1,自引:0,他引:1  
郑志蕴  阮春阳  李伦  李钝 《计算机科学》2016,43(10):242-247
本体语义相似度计算是解决语义网中语义异构的关键环节。通过对传统语义相似度计算方法的分析研究,引入本体层次结构,给出基于信息内容、距离、属性的语义相似度改进计算方法,并采用主成分分析法,提出一种自适应相似度综合加权计算方法(ACWA),以解决传统综合加权计算时人工赋权的不足。实验结果表明,提出的ACWA算法的计算结果与参照标准之间的皮尔森系数较传统算法平均高出了8.1%,有效提升了本体语义相似度计算的准确性。  相似文献   

5.
基于贝叶斯估计的概念语义相似度算法   总被引:2,自引:0,他引:2  
传统的基于语义距离的概念语义相似度算法不能兼顾客观统计数据,基于信息量的相似度算法又难以获得权威统计样本,针对这些不足,该文提出一种基于贝叶斯估计的概念语义相似度算法。该算法首先假定概念出现概率是符合Beta分布的随机变量,然后基于语义距离的相似度算法计算先验参数,并根据统计样本计算该先验分布下基于最小风险的贝叶斯估计后验参数。随后利用基于信息量的语义相似度算法,便可获得主观经验与客观事实相结合的概念语义相似度。结合WordNet的实验分析表明,该算法与人为主观经验之间具有最大的相关系数。  相似文献   

6.
刘双印 《计算机应用》2010,30(5):1304-1308
针对传统电子商务推荐算法的不足,提出了综合语义相似度的案例检索算法。算法通过加权平均商品的概念语义相似度、基于类型的属性语义相似度和基于数据类型的属性值相似度,来计算案例的综合相似度,避免了传统推荐算法中计算相似度仅靠属性值,没考虑语义和属性类型的影响造成的效率低、精度差等问题。设计了领域本体协同案例推理的电子商务智能推荐系统架构,通过在领域本体中抽取语义要素对案例进行表示,拓宽了案例求解空间,达到了协助用户检索及完成商品推荐的任务。经实例对比分析该算法有效且精度较高。  相似文献   

7.
一种基于上下文的语义相似度算法   总被引:2,自引:0,他引:2  
本体中概念映射的关键是概念相似度计算.本文针对目前概念相似度计算所存在的问题,提出了一种基于上下文的计算本体内概念间语义相似度的算法,从概念的父代和子代两个角度进行计算.该算法充分考虑了概念所处的具体应用环境,利用了本体中概念的语义信息.实验结果表明,基于上下文的语义相似度算法比单纯地计算概念闻语义相似度更有效.  相似文献   

8.
在基于距离的语义相似度计算方法的基础上,综合多种因素对相似度的影响,提出一种新的相似度和相关度计算方法。将其应用到教学资源领域本体,计算本体概念间的相似度和相关度。实验结果显示该算法可以提高传统基于距离的相似度算法的性能。最后比较了利用该算法的语义查询与传统关键字查询的结果。  相似文献   

9.
针对传统基于wordnet的词汇语义相似度计算方法中隔离抽象词汇和具象词汇,以及片面依赖上下义关系的不足,提出了基于交通领域知识网络的词汇语义相似度计算方法.基于上下义、工具-工具对象、部件-整体等概念关系准则构建了交通词汇的知识网络图谱,提出了修正的平均路径长度参量计算网络中词汇的语义相似度,得到更高的语义一致性结果.实验表明,在Finkelstein的353对词汇集上,本文算法能够获得比传统方法更符合人工判断的语义相似度.  相似文献   

10.
在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析。现有方法未能充分利用动词及其支配的成分信息,无法满足语义角色标注的相似句检索需求。基于此,本文提出一种新的汉语句子相似度计算方法。该方法基于已标注好语义角色的语料资源,以动词为分析核心,通过语义角色分析、标注句型的相似匹配、标注句型间相似度计算等步骤来实现句子语义的相似度量。为达到更好的实验效果,论文还综合比较了基于知网、词向量等多种计算词语相似度的算法,通过分析与实验对比,将实验效果最好的算法应用到句子相似度计算的研究中。实验结果显示,基于语义角色标注的句子相似度计算方法相对传统方法获得了更好的测试结果。  相似文献   

11.
基于语义的中文文本关键词提取算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为克服传统关键词提取算法局限于字面匹配、缺乏语义理解的缺点,提出一种基于语义的中文文本关键词提取(SKE)算法。将词语语义特征融入关键词提取过程中,构建词语语义相似度网络并利用居间度密度度量词语语义关键度。实验结果表明,与基于统计特征的关键词提取算法相比,SKE算法提取的关键词能体现文档的主题,更符合人们的感知逻辑,且算法性能较优。  相似文献   

12.
王光  姜丽  董帅含  李丰 《计算机工程》2019,45(10):215-220
传统协同过滤推荐算法在处理海量数据时存在数据稀疏性和项目长尾效应,导致推荐精度较低。针对该问题,结合本体语义和用户属性,提出一种改进的协同过滤算法。利用本体计算项目之间的语义相似度,构建项目相似度矩阵,同时引入用户属性计算用户相似度矩阵。通过融合本体语义和用户属性形成用户-项目评分矩阵,并对该矩阵的预测评分进行加权处理,生成TOP-N推荐结果。实验结果表明,相比传统皮尔逊相似度计算协同过滤算法、基于本体语义的协同过滤算法和基于评分矩阵填充与用户兴趣的协同过滤算法,该算法的平均绝对误差较低,准确率较高,综合性能及新颖度较优。  相似文献   

13.
基于动态权值的关联数据语义相似度算法研究   总被引:1,自引:0,他引:1  
贾丽梅  郑志蕴  李钝  王振飞 《计算机科学》2014,41(8):263-266,273
语义相似度计算对关联数据的信息检索有重要作用,直接影响数据的语义挖掘效果。实例的属性信息是关联数据语义相似度计算的一个重要因素。针对传统的关联数据语义相似度算法未考虑属性的重要性和取值类型导致计算精度较低的问题,提出基于动态权值的关联数据语义相似度计算方法,即根据待匹配的数据集中属性不同取值的数量、属性值的分布以及属性的有效性3个因素动态计算属性的权值,然后依据属性取值类型选用匹配相似度算法,最后结合属性的动态权值对概念进行实例的相似度计算。实验表明,基于动态权值的相似度计算方法与传统方法相比,实例相似度的计算精度得到了一定的提高。  相似文献   

14.
为了实现本体概念的自动更新,减少对领域专家的过多依赖,给出一种基于语义相似度的本体概念更新方法 SSOCUM(Semantic Similarity-based Ontology Concept Update Method)。实现一种改进的基于Word Net的相似度算法,该算法在计算路径长度的基础上,综合考虑了概念的节点深度以及信息量对相似度的影响。为了弥补基于Word Net的相似度算法没有考虑概念属性所携带的语义信息的不足,加入属性相似度对其进行调整。通过实验对比,验证了改进算法的计算结果与标准数据集之间的皮尔森系数高于传统算法,计算结果更接近于人的主观判断。采用构建好的煤矿领域通风系统本体对SSOCUM算法进行实验分析。结果表明,SSOCUM算法有助于本体新概念的自动添加,并具有一定的准确性和有效性。  相似文献   

15.
提出一种计算WordNet中概念间语义相似度的算法,该算法同时考虑概念的信息内容(IC)以及2个概念在WordNet is_a关系分类树中的距离信息,由此提高算法性能。给出一种计算概念IC值的新方法,通过考虑概念的子节点数及概念所处WordNet分类树中的深度,使计算结果更精确。与其他5种语义相似度算法的比较结果表明,该算法能够求得更准确的相似度。  相似文献   

16.
术语是由一个到多个单词按照某种语义角色组合而成的,传统的基于统计的相似度计算方法,将术语看作一个基本单元来进行计算,忽略了术语内部的语义角色,且对于上下文信息不丰富的术语,无法利用统计的方法取得理想的效果;基于语义资源的相似度计算方法,所涵盖的词语有限,因此不包含在语义资源中的术语便无法计算相似度。针对这些问题,该文针对专利提出了基于语义角色的术语相似度计算方法,该方法弥补了传统方法的不足。该文对术语内部的单词进行语义角色标注,通过共享最近邻方法计算单词的相似度,然后根据不同的语义角色,利用单词相似度来计算术语相似度。实验表明,该方法与传统方法相比,取得了较好的效果。  相似文献   

17.
基于框架语义分析的汉语句子相似度计算   总被引:4,自引:0,他引:4  
句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语义分析、框架的重要度度量、框架的相似匹配、框架间相似度计算等关键步骤来实现句子语义的相似度量.其中多框架语义分析是从框架角度对句子中的所有目标词进行识别、框架选择及框架元素标注,从而达到全面刻画句子语义的目的;在此基础上根据句子中框架的语义覆盖范围对不同框架的重要度进行区分,能够使得相似度结果更准确.在包含多目标词的句子集上的实验结果显示,基于多框架语义分析的句子相似度计算方法相对传统方法获得了更好的测试结果.  相似文献   

18.
面向虚拟组织资源发现的语义模糊匹配   总被引:2,自引:0,他引:2  
资源发现是虚拟组织提供资源共享和协同工作的前提。本文首先提出一种支持资源动态匹配的资源发现结构;然后针对传统资源匹配技术的不足,在资源元数据本体描述的基础上,结合概念的语言特征和语义特征,提出一种语义模糊匹配算法。通过语义相似度的计算,进而对语义关联进行分类,实现了一定程度的资源模糊匹配,为资源发现提供了新的解决方法。  相似文献   

19.
针对边计算法的语义相似度计算优化算法   总被引:1,自引:0,他引:1  
概念语义相似度计算是诸多应用普遍面临的问题。文中以简化单本体内概念语义相似度计算为出发点,提出针对边计算法的相似度计算优化算法。利用本体概念间的层次关系优化相似度计算过程。优化算法依据本体内一对概念间的语义相似度求出本体内所有概念间的语义相似度。仿真实验表明,优化算法能有效降低语义相似度计算复杂度,计算速度提高约一倍。  相似文献   

20.
汉语词语间语义相似是词语间的基本关系之一,文章提出了一种基于知网和知识图的词语语义相似度计算的方法,通过改进传统的知识图表示方式,根据知网中概念项的抽取结果对词语的义项进行表示,用词图的相似度来表示相应词语的语义相似度。实验结果表明该算法对词语间语义相似度计算是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号