首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
改进的概念相似度算法   总被引:2,自引:0,他引:2       下载免费PDF全文
本体映射是目前的热点问题,而概念相似度计算则是它的关键部分。目前的方法基本上都是基于多策略的综合方法,而综合方法存在计算量大、权值难以确定等问题。提出了一种改进的综合算法-PCASim。该方法通过概念名称相似度计算减少计算量,利用主成分分析改进权值。实验表明该方法是切实可行的。  相似文献   

2.
基于动态权值的关联数据语义相似度算法研究   总被引:1,自引:0,他引:1  
贾丽梅  郑志蕴  李钝  王振飞 《计算机科学》2014,41(8):263-266,273
语义相似度计算对关联数据的信息检索有重要作用,直接影响数据的语义挖掘效果。实例的属性信息是关联数据语义相似度计算的一个重要因素。针对传统的关联数据语义相似度算法未考虑属性的重要性和取值类型导致计算精度较低的问题,提出基于动态权值的关联数据语义相似度计算方法,即根据待匹配的数据集中属性不同取值的数量、属性值的分布以及属性的有效性3个因素动态计算属性的权值,然后依据属性取值类型选用匹配相似度算法,最后结合属性的动态权值对概念进行实例的相似度计算。实验表明,基于动态权值的相似度计算方法与传统方法相比,实例相似度的计算精度得到了一定的提高。  相似文献   

3.
提出一种计算WordNet中概念间语义相似度的算法,该算法同时考虑概念的信息内容(IC)以及2个概念在WordNet is_a关系分类树中的距离信息,由此提高算法性能。给出一种计算概念IC值的新方法,通过考虑概念的子节点数及概念所处WordNet分类树中的深度,使计算结果更精确。与其他5种语义相似度算法的比较结果表明,该算法能够求得更准确的相似度。  相似文献   

4.
语义相似度的计算是自然语言处理中的重要研究内容,在过去几十年的研究工作中,已有大量的语义相似度计算方法被提出并广泛应用于语义消歧、文本聚类等领域中。基于WordNet本体,改进了信息量IC计算模型,进而提出了两种混合式的语义相似度的计算方法。实验结果表明,由于同时考虑了概念节点在WordNet中的最短路径距离和IC语义距离,所提方法优于已有方法,其计算结果更加接近人类的主观判断。  相似文献   

5.
基于朴素贝叶斯模型的单词语义相似度度量   总被引:1,自引:0,他引:1  
单词语义相似度度量是自然语言处理领域的经典和热点问题.通过结合朴素贝叶斯模型和知识库,提出一个新颖的度量单词语义相似度度量途径.首先借助通用本体WordNet获取属性变量,然后使用统计和分段线性插值生成条件概率分布列,继而通过贝叶斯推理实现信息融合获得后验概率,并在此基础上量化单词语义相似度.主要贡献是定义了单词对距离和深度,并将朴素贝叶斯模型用于单词语义相似度度量.在基准数据集R&G(65)上,对比算法评判结果与人类评判结果的相关度,采用5折交叉验证对算法进行分析,样本Pearson相关度达到0.912,比当前最优方法高出0.4%,比经典算法高出7%~13%;Spearman相关度达到0.873,比经典算法高出10%~20%;且算法的运行效率和经典算法相当.实验结果显示将朴素贝叶斯模型和知识库相结合解决单词语义相似度问题是合理有效的.  相似文献   

6.
随着网络的发展,短文本语言计算的研究方兴未艾,且语义相似度在人工智能、认知学、语义学、心理学和生物学等领域里占有重要位置.在已有的传统的相似度研究算法上,为了能更快更准确地计算出相似度,文中通过构建概念树,设法把短文本集中到某个特定的领域.因概念树、概念词典既能表现概念之间的语义关系,又能表现概念层次结构,故而更能大大提高检索效率.在此基础上的相似度计算也使得检索结果更加准确,进而方便研究短文本之间的相似性与唯一性,大大增加了后期对挖掘的正确性.  相似文献   

7.
鉴于词语表达形式与词语语义的多样性,词语语义相似度计算是自然语言处理、智能检索、文档聚类等领域的一个研究热点。文中根据词语表达方式的特点,在基于词语语义词典和基于大规模语料库这两种计算词语语义相似度方法的基础之上,提出一种改进的主观和客观相结合的词语相似度计算方法。从方法论的角度,本算法既融合了主观经验主义思想也融合了客观的理性主义思想,使得词语语义相似度的计算结果能够更加准确。实验结果表明采用文方法是有效的,能够显著提高词语语义相似度计算结果的准确性。  相似文献   

8.
通过对两种传统的语义相似度算法学习及数据对比,看到了不足之处。面对庞大的信息资源,大家对资源的理解是不同的,相同或相近的资源标注就会有所不同。用传统的语义相似度算法去标注资源就会出现理解上的差异问题。  相似文献   

9.
语义相似度计算的应用范围广泛,从心理学、语言学、认知科学到人工智能都有其应用.提出了仅依赖于知网(HowNet)的信息量计算来估计两个词汇间的语义相似度.经实验证明,相比于传统的基于词网(WordNet)和大型语料库的计算信息量来估计语义相似度的算法,本文的算法更容易计算,并更接近于人工的语义相似度判断.  相似文献   

10.
给出了一个新的用于计算WordNet中概念的语义相似度的IC(信息内容)模型。该模型以WordNet的is_a关系为基础,只通过WordNet本身结构就可求出WordNet中每个概念的IC值,而不需要其他语料库的参与。该模型不仅考虑了每个概念所包含的子节点的个数,而且将该概念所处WordNet分类树中的深度引入到模型当中,使得概念的IC值更为精确。实验结果显示将该模型代入到多个相似度算法当中,可以明显提高这些算法的性能。  相似文献   

11.
文本相似度算法研究一直是文本挖掘领域非常重要的算法,指采用一定的策略比较两个文本之间的相似程度,目前文本相似度算法已经在文本分类、文本聚类、自然语言处理等多个领域崭露头角。本文主要就语义角度出发对文本之间相似度进行界定。  相似文献   

12.
为解决本体异构、实现不同本体应用程序间互操作以及数据集成,提出一种基于RDF图的改进相似度传播匹配算法。首先通过WordNet发现初始相似对种子,经过预处理把本体表示成RDF三元组形式,针对RDF图的特点,将相似度传播的条件扩展到三元组中,发现可能相似对;然后采用综合元素特征的方法计算相似度。相似度传播、发现可能相似对种子、相似度计算是一个循环迭代的过程,直到满足收敛条件。实验表明了该算法的有效性,并在时间性能上也有所提高。  相似文献   

13.
基于语义网的语义相似度算法改进   总被引:20,自引:4,他引:16  
传统的语义相似度算法采用纯语义距离或以本体库的统计特性为基础。论文的改进算法把这两者结合起来,互为约束,并且加入了“深度”和“密度”对语义距离的辅助影响。改变语义相关性的比重只需调节算法中的一个参数。最后通过WordNet构造的局部语义树,比较了各算法的有效性。  相似文献   

14.
一种基于本体的句子相似度计算方法   总被引:2,自引:0,他引:2  
刘宏哲 《计算机科学》2013,40(1):251-256
提出了一种基于树结构本体的句子相似度计算方法。利用本体概念与句子中关键词之间建立的语义索引,构建句子与本体间的直接和间接语义联系,据此提取描述句子的语义向量,从而计算句子间的语义相似度。应用微软研究院的意译语料库(MSRP)对本方法进行了验证,结果表明:与相关的计算方法相比,本方法在不完备附加信息应用前提下获得了较好的准确率和召回率。  相似文献   

15.
信息检索中语义相似度算法研究   总被引:1,自引:0,他引:1  
为提高信息检索的查全率与查准率,提出一种改进的本体语义相似度计算方法。该方法在语义距离的计算中加入了深度、密度、类型三种权重因子,并且综合考虑语义重合度、概念的属性对相似度的影响。通过实验分析,该方法比传统计算方法更加准确、有效。  相似文献   

16.
在网格中实现更加准确有效的服务发现、查询及其动态分配和替换,需要在语法匹配的基础上进一步实现语义匹配。语义匹配的关键在于语义相似度的计算。本文首先分析传统的相似度计算方法的特点以及存在的问题,提出一种新的改进算法。改进的算法考虑了深度影响因素,并引入多种语义关系且对这些关系分别赋予不同的权值,最后给信息量赋予了一种新的度量方法;文章最后给出相关实验结果,并比较了各算法的有效性。  相似文献   

17.
针对现有社交好友推荐算法只关注"人"忽略"事"的问题,提出一种基于关联规则与相似度的推荐算法。通过对用户每天发布的信息进行相似度计算,将相似度达到给定阈值的信息视为一条交易记录,把发布的信息视为交易项,信息库视为交易数据库,计算出二阶候选项集,推荐支持数最高的前N项信息的发布者为好友。实验结果表明,与基于关联规则与标签的好友推荐算法相比,该算法具有较高的准确率。  相似文献   

18.
为了实现制造资源本体之间的语义互操作,对本体中的概念进行语义相似性计算为进行此操作的关键技术之一。本文提出了一种计算概念语义相似度的新方法,将概念语义相似度分为两部分:主体相似度和附加相似度。主体相似度综合考虑了概念自身的相似度,该概念的父概念和子概念间的相似度,以及概念间的二元关系,同时,加入了概念属性相似度,属性携带了概念的大部分语义信息,计算属性相似度可以有效提高概念语义相似度的准确性。附加相似性是指通过本体中概念的层次结构对主体相似度进行语义补充,利用概念的深度对得到的概念语义相似度进行语义调整,有效的弥补了仅仅利用主体相似度计算概念语义相似度的不足。最后,通过实例证明了该方法的有效性。  相似文献   

19.
针对关联规则个性化好友推荐中规则挖掘效率及推荐有效性不高的问题,首先提出基于散列及位图的改进关联规则算法BHA。该算法通过引入散列技术,减少了频繁2项集挖掘所需的时间;利用位图及相关性质,压缩无关候选项,减少了数据集所需的遍历次数。另外,在BHA的基础上,提出基于相似度及信任度的推荐算法STA,利用出、入相似度定义信任度,有效解决了新浪微博未提供显示信任关系的问题,同时弥补了相似度推荐未考虑用户间远近层次关系的缺陷。采集新浪微博用户数据进行实验,在关联规则挖掘效率的对比上,BHA挖掘所需的平均时间仅为改进AprioiriTid算法的47%;在好友推荐的有效性上,推荐算法STA较SNFRBOAR算法在准确率及召回率上分别提升了15.2%和9.8%。实验结果表明,STA能够有效降低规则挖掘所需的平均时间,并使实际好友推荐的有效性得到提升。  相似文献   

20.
一种基于上下文的语义相似度算法   总被引:2,自引:0,他引:2  
本体中概念映射的关键是概念相似度计算.本文针对目前概念相似度计算所存在的问题,提出了一种基于上下文的计算本体内概念间语义相似度的算法,从概念的父代和子代两个角度进行计算.该算法充分考虑了概念所处的具体应用环境,利用了本体中概念的语义信息.实验结果表明,基于上下文的语义相似度算法比单纯地计算概念闻语义相似度更有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号