首页 | 本学科首页   官方微博 | 高级检索  
     

不等式最大熵中的特征选择方法
引用本文:张永,李晓红,樊斌. 不等式最大熵中的特征选择方法[J]. 计算机工程, 2009, 35(18): 182-184
作者姓名:张永  李晓红  樊斌
作者单位:兰州理工大学计算机与通信学院,兰州,730050;兰州理工大学计算机与通信学院,兰州,730050;兰州理工大学计算机与通信学院,兰州,730050
摘    要:不等式最大熵模型较为成功地缓解了文本分类任务中的过拟合问题,但它使用的特征选择算法不能完全发挥不等式最大熵的最大优势。针对该问题提出采用改进的顺序前进式选择算法,提高文本分类任务中的识别率,试验结果证明该算法能够更准确地选出文本代表特征,对不等式最大熵模型的分类成绩有一定的改善。

关 键 词:不等式最大熵  特征选择  文本分类
修稿时间: 

Feature Selection Method for Inequality Maximum Entropy
ZHANG Yong,LI Xiao-hong,FAN Bin. Feature Selection Method for Inequality Maximum Entropy[J]. Computer Engineering, 2009, 35(18): 182-184
Authors:ZHANG Yong  LI Xiao-hong  FAN Bin
Affiliation:School of Computer and Communication;Lanzhou University of Technology;Lanzhou 730050
Abstract:Inequality maximum entropy method has alleviated data sparseness with flexible modeling capability more successfully than other probabilistic models in text classification tasks, but feature selection algorithm used by the model can not fully bring its advantage.This paper proposes a new feature selection method.It improves the recognition rate in text classification.Experimental result shows that this algorithm works more effectively in selecting representative features and improves the text classification...
Keywords:inequality maximum entropy  feature selection  text classification  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号