首页 | 本学科首页   官方微博 | 高级检索  
     

文本分类中特征选择方法的研究与比较
引用本文:王喆.文本分类中特征选择方法的研究与比较[J].内蒙古石油化工,2011(19):18-20.
作者姓名:王喆
作者单位:内蒙古化工职业学院,内蒙古呼和浩特,010010
摘    要:介绍了进行文本分类的关键技术,并着重介绍了常用的文本特征提取方法。选取支持向量机方法作为文本分类器方法,选取不同特征提取方法应用于文本分类,通过实验,比较和分析了由不同的提取方法所构成的分类器的分类性能,确定了信息增益(IG)法和文本证据权(W ET)为两种性能优异的特征提取方法。该结论可为分类性能进一步的优化研究奠定理论和实践基础。

关 键 词:文本分类  互信息  信息增益  SVM  特征提取

Study and Comparation on Feature Selection method in Chinese Text Categorization
Abstract:The article introduce critial technique of text categorization,and Introduce especially the method about selection of text feather.Choising SVM as the method of text classifion training and choise the different methods in selection of text feather,we compare and analyze the categorization capacity which is moded of different method about selection of text feather by experiment.we can get the conclusion that IG and WET are best methods of selection of text feather,which will lay solid foundation for theory a...
Keywords:Text Categorization  Mutual Information  Information Gain  SVM  Feather Selection  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号