首页 | 本学科首页   官方微博 | 高级检索  
     

基于引文相关性排序的科技论文检索方法
引用本文:尹盼盼,崔荣一. 基于引文相关性排序的科技论文检索方法[J]. 计算机工程与设计, 2011, 32(12): 4223-4226,4250
作者姓名:尹盼盼  崔荣一
作者单位:延边大学计算机科学与技术学科智能信息处理研究室,吉林延吉,133002
摘    要:为了实现学术主题相关的科技论文检索,提出了一种基于引文相关性排序的科技论文检索方法。自动抽取科技论文的结构信息,获得论文的标题、摘要、关键词和引文;根据引文与标题的相关性,评价引文的重要性,用引文的评价得分修正引文向量特征项的权重,构造引文的词项-文档关联矩阵,并利用奇异值分解方法构造引文的潜在语义空间,计算查询论文与文档库中论文的引文语义相关性;采用信息增益方法确定了引文相关性阈值,将引文相关性超过阈值的科技论文作为检索结果返回。实验结果表明,提出的检索方法的准确率、召回率、综合性能均高于基于概括性信息(标题、摘要、关键词)的检索方法。

关 键 词:潜在语义索引  引文相关性  奇异值分解  信息增益  文本检索

Approach to sci-tech papers retrieval based on citation relevance ranking
YIN Pan-pan,CUI Rong-yi. Approach to sci-tech papers retrieval based on citation relevance ranking[J]. Computer Engineering and Design, 2011, 32(12): 4223-4226,4250
Authors:YIN Pan-pan  CUI Rong-yi
Affiliation:YIN Pan-pan,CUI Rong-yi(Intelligent Information Processing Laboratory,Department of Computer Science and Technology,Yanbian University,Yanji 133002,China)
Abstract:To implement academic-theme-based retrieval of sci-tech papers,a sci-tech papers retrieval method is proposed.Firstly,structure information of the sci-tech papers are extracted automatically to obtain title,abstract,Key words and references.Secondly,the importance of citations is evaluated in terms of the relevance between citations and title,and furthermore,term weights of citation vector are modified with evaluation scores,term-document matrix is constructed,which the latent semantic space is constructed ...
Keywords:latent semantic indexing  citation relevance  SVD  information gain  text retrieval  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号