首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于类别信息的改进文本特征选择
引用本文:刘海峰,刘守生,汪泽焱.一种基于类别信息的改进文本特征选择[J].计算机应用与软件,2010,27(6):8-10,56.
作者姓名:刘海峰  刘守生  汪泽焱
作者单位:解放军理工大学理学院,江苏,南京,210007
基金项目:国家自然科学基金资助项目 
摘    要:信息增益方法从整个训练集角度进行特征赋权,该模式不适合构造类别特征向量.通过改进的朴素贝叶斯方法选择类别特征用于构造类别向量,再利用词频信息改进信息增益模型用于文本特征选择,改善了信息增益模型对于中频词信息利用不足问题,提出一种基于类别的文本特征加权改进模型.随后的文本分类试验表明,提出的加权模型相比较于传统的信息增益方法具有较好的文本分类效果.

关 键 词:文本分类  特征选择  贝叶斯方法  特征加权

AN IMPROVED TEXT FEATURE SELECTION METHOD BASED ON CATEGORY INFORMATION
Liu Haifeng,Liu Shousheng,Wang Zeyan.AN IMPROVED TEXT FEATURE SELECTION METHOD BASED ON CATEGORY INFORMATION[J].Computer Applications and Software,2010,27(6):8-10,56.
Authors:Liu Haifeng  Liu Shousheng  Wang Zeyan
Affiliation:Liu Haifeng Liu Shousheng Wang Zeyan(Institute of Sciences,PLA University of Science and Technology,Nanjing 210007,Jiangsu,China)
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号