首页 | 本学科首页   官方微博 | 高级检索  
     

一种新的基于多启发式的特征选择算法
引用本文:朱颢东,钟勇.一种新的基于多启发式的特征选择算法[J].计算机应用,2009,29(3):849-851.
作者姓名:朱颢东  钟勇
作者单位:中国科学院,成都计算机应用研究所,成都,610041;中国科学院,研究生院,北京,100039
基金项目:四川省科技计划,四川省科技厅科技攻关项目,中国科学院人才培养计划 
摘    要:在查询扩展方法中,如果通过查询结果中关键词的上下文来计算候选关键词的权重,将权重大的词作为查询扩展词,其候选关键词来源于文档中关键词的上下文,这种方法存在主题漂移的问题。为了解决这个问题,提出一种将初始查询结果过滤,只选择与源文档语境相似的搜索结果,来帮助选择查询扩展词的方法。实验结果表明该方法能获得更合适的查询扩展词。

关 键 词:文本分类  特征空间  特征选择  互信息  文档频
收稿时间:2008-09-23
修稿时间:2008-10-21

New feature selection algorithm based on multiple heuristics
ZHU Hao-dong,ZHONG Yong.New feature selection algorithm based on multiple heuristics[J].journal of Computer Applications,2009,29(3):849-851.
Authors:ZHU Hao-dong  ZHONG Yong
Affiliation:1.Chengdu Institute of Computer Application;Chinese Academy of Sciences;Chengdu Sichuan 610041;China;2.Graduate School;Beijing 100039;China
Abstract:In order to enhance the operation speed,reduce the memory space occupied and filter out irrelevant or low-degree relevant features,feature selection algorithm must be used.One novel feature selection algorithm named as selection method using multiple heuristic rules was presented.The algorithm comprehensively considered features,so features could be selected more effectively and accurately.Experimental results show that the algorithm is better than mutual information,chi-square statistic and document freque...
Keywords:text categorization  feature spaces  feature selection  mutual information  document frequency
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号