首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
面向主题的概念检索研究   总被引:3,自引:1,他引:2  
该文提出了一种基于概念网络和主题概念树的面向主题的文本检索算法。依托概念网络建立主题概念树,利用主题概念树对用户的查询请求进行语义扩展,实现同义和语义蕴涵检索。关联度的计算模型考虑了词与词之间,句与句之间的语义激励。通过关联度在主题概念树上的传播模型,实现复合概念关联度的计算。检索结果按关联度大小降序排列。基于主题概念树的概念检索导航为用户检索提供了便利。  相似文献   

2.
自然语言词汇的语义相关度的计算需要获取大量的背景知识,而维基百科是当前规模最大的百科全书,其不仅是一个规模巨大的语料库,而且还是一个包含了大量人类背景知识和语义关系的知识库,研究表明,其是进行语义计算的理想资源,本文提出了一种将维基百科的链接结构和分类体系相结合计算中文词汇语义相关度的算法,算法只利用了维基百科的链接结构和分类体系,无需进行复杂的文本处理,计算所需的开销较小.在多个人工评测的数据集上的实验结果显示,获得了比单独使用链接结构或分类体系的算法更好的效果,在最好的情况下,Spearman相关系数提高了30.96%.  相似文献   

3.
词汇语义关联度计算是信息检索和自然语言处理的关键问题之一。针对该问题提出一种改进的基于Wikipedia语义关联度计算方法 WGR。该方法使用Wikipedia数据集作为背景知识库,在传统方法的基础上融合维基文章中的布局信息,并对维基概念的入链和出链使用不同的方法进行处理;引入Google搜索资源,经分类筛选后使用LDA建模计算关联度;最后综合两个数据集的结果得到WGR语义关联度。通过实验分析,WGR在与现有算法比较时,取得了更好的准确率。  相似文献   

4.
针对传统人工编辑导致大量类别信息重复和不规范的问题,提出了应用协同过滤技术为中文维基百科文章自动推荐类别。利用中文维基百科中的四个重要语义特征即链入、链出、链入的类别和链出的类别来表示维基百科文章,得到与目标文章相似的前若干篇文章的所有类别后,通过查询返回的相似度值计算各个类别的权重,选择前面的若干个类别作为推荐结果返回给目标文章。实验结果表明了这四个语义特征能较好地表征一篇维基百科文章,同时也验证了协同过滤方法在中文维基百科自动推荐类别中的有效性。  相似文献   

5.
利用维基百科备份数据库自动构建领域概念语义网络,为领域信息智能检索提供技术基础。对维基百科备份数据库进行下载、分析、筛选处理后,以网络技术学科为研究领域,利用维基百科数据库中的条目数据,设计算法,提取网络技术领域的所有概念;通过维基百科备份数据库中的分类、链接、重定向数据,提取该领域概念之间的同义及上下级关系,最终汇总形成网络技术领域概念语义网络。   相似文献   

6.
《微型机与应用》2015,(14):12-14
在总结维基百科特点的基础上,调研了国内外使用维基百科计算语义相关度的算法。根据这些算法的特点,对其进行了系统的分类,并列举了每个分类下的经典算法。  相似文献   

7.
引文推荐(CR)聚焦于智能化地产生与查询文章相关的文献列表,对科学研究具有重要价值.引文推荐有关于文章的语义信息和结构信息,近年来,基于网络表示学习(NRL)的引文推荐获得广泛关注.但现有研究使用单粒度网络来建模引文推荐问题,存在计算复杂度高、内存消耗大的弊端.为克服这个挑战,提出一种基于多粒度属性网络表示学习的引文推荐算法(CR-HANRSL),可以大大提升网络表示学习效率并同时兼顾文章的语义和结构特征.首先,根据文章结点属性的语义关联度和作者关系反复将网络粗化成更小的网络,并在每次粗化后都让超结点融合子结点的文本属性为粗化后的网络计算语义连边.随后,利用单粒度网络表示学习方法学习粗化后的网络特征表示并通过学习图卷积神经网络,对原网络的表示进行细化.最后,融合文章间多模态特征表示相似度产生推荐列表.在AAN和DBLP两个数据集上的实验结果表明提出的方法可以在学习高质量网络特征表示的前提下大大提升网络表示学习效率.  相似文献   

8.
《软件工程师》2019,(10):36-43
针对目前基于维基百科的相似度计算方法预处理过程烦琐、计算量大的问题,本文以维基百科为本体引入基于特征的词语语义计算,提出了一种基于维基百科的快速词语相似度计算方法。根据维基百科页面链接结构的特点,该方法把页面的入链接和出链接作为页面特征值构建特征向量模型,通过计算页面的特征向量相关系数计算对应词语的语义相似度。本文还改进了维基百科消歧处理算法,在一词多义的处理中减少社会认知度低的义项页面的干扰,进一步提高了计算准确度。经Miller&Charles(MC30)和Rubenstein&Goodenough(RG65)测试集的测试,测试结果表明了基于维基百科链接特征的方法在计算相似度方面的可行性,也验证了本文的计算策略和消歧改进算法的合理性。  相似文献   

9.
基于概念网络的文本分类研究   总被引:1,自引:0,他引:1  
提出了一种基于概念网络和主题概念树的文本分类算法。该算法可以根据关联度传播模型对未知文本中的一些概念进行一定程度上的语义复合。  相似文献   

10.
基于维基百科社区挖掘的词语语义相似度计算   总被引:1,自引:0,他引:1  
词语语义相似度计算在自然语言处理如词义消歧、语义信息检索、文本自动分类中有着广泛的应用。不同于传统的方法,提出的是一种基于维基百科社区挖掘的词语语义相似度计算方法。本方法不考虑单词页面文本内容,而是利用维基百科庞大的带有类别标签的单词页面网信息,将基于主题的社区发现算法HITS应用到该页面网,获取单词页面的社区。在获取社区的基础上,从3个方面来考虑两个单词间的语义相似度:(1)单词页面语义关系;(2)单词页面社区语义关系;(3)单词页面社区所属类别的语义关系。最后,在标准数据集WordSimilarity-353上的实验结果显示,该算法具有可行性且略优于目前的一些经典算法;在最好的情况下,其Spearman相关系数达到0.58。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号