共查询到20条相似文献,搜索用时 140 毫秒
1.
在传统检索模型的基础上,结合本体的概念,提出一种基于本体语义树的主题空间向量模型,该模型能够用语义概念树描述一个主题,与传统基于关键词描述主题的方法不同,它能够描述概念之间的简单语义关系.在此基础上,给出HTML页面内容与主题相关度的计算方法.在分析URL的相关度时,不仅分析链接锚文本与主题相关度,还结合了改进的Pag... 相似文献
2.
3.
4.
5.
语义查询扩展中词语-概念相关度的计算 总被引:16,自引:0,他引:16
在基于语义的查询扩展中,为了找到描述查询需求语义的相关概念,词语.概念相关度的计算是语义查询扩展中的关键一步.针对词语.概念相关度的计算,提出一种K2CM(keyword to concept method)方法.K2CM方法从词语.文档.概念所属程度和词语.概念共现程度两个方面来计算词语.概念相关度问语.文档.概念所属程度来源于标注的文档集中词语对概念的所属关系,即词语出现在若干文档中而文档被标注了若干概念.词语.概念共现程度是在词语概念对的共现性基础上增加了词语概念对的文本距离和文档分布特征的考虑.3种不同类型数据集上的语义检索实验结果表明,与传统方法相比,基于K2CM的语义查询扩展可以提高查询效果. 相似文献
6.
根据贝叶斯定理提出一种衡量领域本体中概念间语义相关度的概率模型。该模型定义在不同语义关系之上,基于极大似然估计法利用语义距离来对语义关系进行参数估计。并在此基础给出一种计算任意两个概念之间语义相关度的方法。公开数据集上的实验结果表明该方法估计出的概念语义相关度具有相当的有效性,应用在语义查询扩展中可明显提高检索效果。 相似文献
7.
为提高网页内容与特定主题之间相关度计算的准确度,提出一种基于领域本体的网页主题相关度计算模型OBWTCCM(ontology based webpage-topic correlation calculation model)。使用领域本体刻画主题,通过计算本体概念间的语义关系提取主题概念并构造主题语义矩阵,将特征词的统计信息与该矩阵相结合计算网页与主题之间的相关度。该模型改进了向量空间模型在相关度计算时对特征词语义层次分析的不足。实际项目应用结果表明,使用该方法计算得到的网页主题相关度与领域专家的判断总体相符,具有较理想的准确度。 相似文献
8.
语义相关度计算在信息检索、词义消歧、自动文摘、拼写校正等自然语言处理中均扮演着重要的角色。该文采用基于维基百科的显性语义分析方法计算汉语词语之间的语义相关度。基于中文维基百科,将词表示为带权重的概念向量,进而将词之间相关度的计算转化为相应的概念向量的比较。进一步,引入页面的先验概率,利用维基百科页面之间的链接信息对概念向量各分量的值进行修正。实验结果表明,使用该方法计算汉语语义相关度,与人工标注标准的斯皮尔曼等级相关系数可以达到0.52,显著改善了相关度计算的结果。 相似文献
9.
10.
《计算机应用与软件》2016,(11)
针对民航突发事件领域本体非分类关系的语义查询扩展问题,提出一种面向领域本体非分类关系的语义相关度计算方法。该方法在数据属性方面,提出基于属性类型和属性值的语义相关度计算方法;在对象属性方面,针对查询词与本体概念或实例存在多种对象属性问题,提出基于对象属性的语义相关度计算方法,并结合领域本体在民航突发事件案例的语义查询过程给出了该方法的实现效果分析。该方法不仅有效地提高了语义查询的准确率和查全率,也为民航突发事件的应急决策提供了更好的方法支持。 相似文献
11.
Web信息检索技术已经在全世界广泛应用,然而,搜索引擎的查全率和查准率却不能够令用户满意,因此提出了一种基于通用本体WordNet的语义层次结构.通过计算和分析查询关键字与本体库的映射达到查询优化的目的.该方法通过建立一个简单的语法树并且索引WordNet,对查询关键字词法特性和本体实例之间语义关联强弱进行扩展和分析,提高了查询关键字到本体概念映射的完整性和准确率,进而帮助搜索引擎对用户的意图作出有效推测.实验表明,该方法可以有效地优化查询. 相似文献
12.
针对目前多策略本体映射中各种映射策略不能根据待映射本体间的差异进行不同的映射处理、多策略集成时也没有充分利用本体包含的语义信息等问题。提出了一种动态多策略本体映射与集成方法,该方法首先对部分关键策略进行了动态地改进,然后利用层次分析法对不同的映射策略进行集成,从而得到最终的映射结果。实验结果表明,该方法在保证通用性和稳定性的同时,提高了映射结果的查全率和查准率。 相似文献
13.
本体映射是语义集成的关键,国内外对本体映射进行了深入的研究。将机器学习的方法引入到组合概念相似度的权值计算中来,提出了基于Widrow-Hoff理论的权值确定算法LMSW。通过梯度下降法来搜索最佳拟合训练样例的权向量,从而计算出组合的概念相似度,最终实现组合多种概念相似度算法的本体映射。实验表明该算法比单独使用概念相似度计算方法在查全率、查准率上均有所提高。 相似文献
14.
15.
自组织中文语义映射网络的优化特征编码方法 总被引:2,自引:0,他引:2
本文介绍自组织中文语义映射网络,并分别基于集合论、代数理论和概率论研究和提出六种不同的特征编码方法,这对自组织语义映射效果有很重要的影响。通过性能评价得出如下结论:使用TFIDF修正的频率密度编码能得到最佳效果,其语义映射的精确度和召回率分别为94.4%和90.7% ,而基于向量模型的方法则都不适用于中文自组织语义映射。文中给出结果分析。另外比较实验结果表明文中的最好方法其系统性能好于目前广泛采用的分层聚类技术,并远好于多元统计分析技术,例如主成分分析的特征降维编码。 相似文献
16.
针对目前大多数本体映射方法在应用于不同的映射任务时,各种映射策略不能对本体间的差异进行不同的处理,多策略结合时也没有充分利用本体的语义信息的问题,提出了一种改进的多策略映射与结合方式的方法。该方法对部分关键映射策略进行了改进,并通过对多策略的评价,考虑是否利用模糊层次分析法最优地结合各种策略。实验表明,该方法在保证通用性和稳定性的同时,提高了映射结果的查全率和查准率。 相似文献
17.
黎明 《计算机工程与应用》2010,46(17):160-162
已有的本体复合映射算法中,绝大部分都只能发现基于字符串比较的简单类型的复合映射,查准率和查全率不高。提出一种基于结点间包含关系和等价关系发现复合映射的方法。实验证明,该方法可以发现本体中包含的绝大部分复合映射,较之现有的复合映射发现算法在查准率和查全率方面有了很大改进。 相似文献
18.
针对传统的基于模板匹配、人工构建特征、语义匹配等解决术语标准化的方案,往往会存在术语映射准确率不高,难以对齐等问题.本文结合医疗领域的文本中术语口语化、表达多样化的特点,使用了多策略召回和蕴含语义评分排序模块来提升医学术语标准化效果.在多策略召回模块中使用了基于Jaccard相关系数、TF-IDF、历史召回方法进行召回,在蕴含语义评分模块使用了RoBERTa-wwm-ext作为判分语义模型.首次在医学专业人员标注的基于SNOMED CT标准的中文数据集上验证了可用性.实验证明,在医疗知识特征的处理中,本方法能够在医学术语标准化实际应用上达到不错的效果,具有很好的泛化性及实用价值. 相似文献
19.
随着电子学习系统快速的发展,电子学习资源呈现爆炸式的增长,如何有效地组织海量电子学习资源成为构建高效电子学习系统的重要因素。针对现有资源库在资源组织方面存在的不足,提出了一个基于领域知识本体的电子学习资源库检索模型,该模型利用领域知识来构建领域知识本体库并通过抽取电子学习资源元数据构建元数据库,通过映射关系完成对电子学习资源的语义组织,并在此基础之上构建一个语义检索模型,以有效地解决现有电子学习资源检索中丢失语义背景的问题,使检索结果在查全率、查准率方面有所提高,更加符合用户的需求。 相似文献
20.
基于知识本体的语义信息检索框架设计 总被引:4,自引:2,他引:4
基于关键词匹配的信息检索方式不能反映出被检关键字在现实世界中的语义,因此这种检索方式不可避免地导致查准率和查全率低的缺陷,而概念检索中的主体词典表达领域知识的能力有限。提出了一个基于知识本体的能够实现语义信息检索的多主体系统,它包括描述信息收集、存储、语义匹配和语义相关性扩展等几个主要部分,可以在很大程度上提高检索结果的查准率和查全率。 相似文献