首页 | 本学科首页   官方微博 | 高级检索  
     

文本分类中基于位置和类别信息的一种特征降维方法*
引用本文:刘海峰,王元元,张学仁,姚泽清b.文本分类中基于位置和类别信息的一种特征降维方法*[J].计算机应用研究,2008,25(8):2292-2294.
作者姓名:刘海峰  王元元  张学仁  姚泽清b
作者单位:1. 解放军理工大学指挥自动化学院,南京,210007;解放军理工大学理学院,南京,210007
2. 解放军理工大学指挥自动化学院,南京,210007
3. 解放军理工大学理学院,南京,210007
基金项目:国家自然科学基金资助项目(70571087)
摘    要:从文本特征项所处的位置角度提出了特征项基于位置的降维方法;同时结合特征的类别分布进行了二次特征降维。这种基于位置和类别相结合的特征降维方法在最大程度减少信息损失的条件下,实现了特征维数的有效压缩。实验表明,该方法有较高的文本分类效率。

关 键 词:文本分类    特征选择    特征降维    位置加权    类别分布

Method of feature reduction in text classification based on position and sort information
LIU Hai feng,WANG Yuan yuan,ZHANG Xue ren,YAO Ze qingb.Method of feature reduction in text classification based on position and sort information[J].Application Research of Computers,2008,25(8):2292-2294.
Authors:LIU Hai feng  WANG Yuan yuan  ZHANG Xue ren  YAO Ze qingb
Affiliation:(a. Institute of Command Automation, b.Institute of Sciences, PLA University of Science & Technology, Nanjing 210007, China)
Abstract:From the position of the terms,this paper put forward a method to reduce the dimensionality.Meanwhile,combined with the sorts distributing,it once more reduced the feature dimension.Therefore,in precondition of the information loss least,connecting with the two aspects,used this method to complete the text feature decrease smartly.The test shows that this method has better precision in the text categorization.
Keywords:text categorization  feature selection  feature reduce  position  weight  sort distribution
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号