首页 | 本学科首页   官方微博 | 高级检索  
     

基于互信息的文本特征选择方法研究与改进
引用本文:刘健,张维明. 基于互信息的文本特征选择方法研究与改进[J]. 计算机工程与应用, 2008, 44(10): 135-137. DOI: 10.3778/j.issn.1002-8331.2008.10.039
作者姓名:刘健  张维明
作者单位:国防科技大学 信息系统与管理学院,长沙 410073
基金项目:国家自然科学基金(the National Natural Science Foundation of China under Grant No.70371008)
摘    要:通过对互信息(MI)文本特征选择方法与信息增益、卡方统计方法的实验研究比较,发现了影响MI方法性能的主要因素是特征选择过程中的随机性,通过加入扰动因子的方法对MI方法进行了改进,消除了随机性的影响,实验表明,改进后的MI方法与信息增益、卡方统计方法比较,具有较明显的优势。

关 键 词:互信息  信息增益  CHI  文本分类  特征选择  
文章编号:1002-8331(2008)10-0135-03
收稿时间:2007-09-20
修稿时间:2007-09-20

Study and improvement of mutual information based text feature selection method
LIU Jian,ZHANG Wei-ming. Study and improvement of mutual information based text feature selection method[J]. Computer Engineering and Applications, 2008, 44(10): 135-137. DOI: 10.3778/j.issn.1002-8331.2008.10.039
Authors:LIU Jian  ZHANG Wei-ming
Affiliation:School of Information System and Management,National University of Defense Technology,Changsha 410073,China
Abstract:A study on the contrast of text selection methods based on mutual information,information gain and CHI has been taken in this paper,find the main factor restrains the performance of MI method is randomicity,an improvement is proposed.The experiment shows that the improved method has good performance and is better than IG and CHI method.
Keywords:mutual information  information gain  CHI  text classification  feature selection
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号