首页 | 本学科首页   官方微博 | 高级检索  
     

基于图的特征词权重算法及其在文档排序中的应用
引用本文:黄云,洪佳明,颜一鸣.基于图的特征词权重算法及其在文档排序中的应用[J].计算机系统应用,2012,21(6):216-219,194.
作者姓名:黄云  洪佳明  颜一鸣
作者单位:1. 吉首大学软件学院,张家界427000;中山大学信息科学与技术学院,广州510006
2. 中山大学信息科学与技术学院,广州,510006
3. 吉首大学软件学院,张家界,427000
基金项目:湖南省教育厅自然科学基金
摘    要:信息检索的核心工作包括文档的分类和排序等操作,如何对文档中的特征词权重进行有效度量是其中的一项关键技术。利用词的共现等关系为每个文档建立文本图,基于邻接词间重要性相互影响的思路,结合文档中特征词的词频特性,迭代计算每个词的权重,进一步结合文本图的密度等全局特性,对信息检索的结果进行排序。实验证实,算法在标准数据集上具有良好的效果。

关 键 词:文本图  共现关系  文档排序  特征词权重
收稿时间:2011/9/23 0:00:00
修稿时间:2011/11/14 0:00:00

Graph-Based Term Weighting for Document Ranking
HUANG Yun,HONG Jia-Ming and YAN Yi-Ming.Graph-Based Term Weighting for Document Ranking[J].Computer Systems& Applications,2012,21(6):216-219,194.
Authors:HUANG Yun  HONG Jia-Ming and YAN Yi-Ming
Affiliation:1(School of Software, Jishou University, Zhaagiiajie 427000, China) 2(School of Information Science and Technology, Sun Yat-Sen University, Guangzhou 510006, China)
Abstract:The core work of information retrieval including document classification and ranking operations, how to effectively compute the term weight of every document is one of a key technology. Use of the word relationship to create a text graph for each document, based on the idea of the importance of interaction between adjacent words, combining the characteristics of the word document word frequency characteristics, we iteratively compute weighting of each word. Further combining the global properties of text graph, such as density, we could rank the results of information retrieval. Experiments confirmed that the algorithm in standard data sets with good results.
Keywords:text graph  co-occurrence relation  document ranking  term weight
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号