首页 | 本学科首页   官方微博 | 高级检索  
     

文本分类中基于散度差的线性特征抽取方法
引用本文:刘海峰,王元元,姚泽清,张述祖. 文本分类中基于散度差的线性特征抽取方法[J]. 计算机工程与设计, 2009, 30(7)
作者姓名:刘海峰  王元元  姚泽清  张述祖
作者单位:1. 解放军理工大学,理学院,江苏,南京,210007;解放军理工大学,指挥自动化学院,江苏,南京,210007
2. 解放军理工大学,指挥自动化学院,江苏,南京,210007
3. 解放军理工大学,理学院,江苏,南京,210007
摘    要:分析了特征选择与特征抽取的特点与不足,针对Fisher线性鉴别准则存在问题,在一种加权散度差线性鉴别准则的基础上提出了一种基于散度差与SVD相结合的文本特征抽取方法.在解决了类内散布矩阵Sw的奇异性问题困扰同时,通过对低阶矩阵的奇异值分解取代了对高阶矩阵的特征值求解,计算量大大减少.在最低限度减少信息损失的前提下实现了特征维数的大幅度减缩.试验结果表明,这种方法在文本分类上的准确性较好.

关 键 词:文本分类  特征选择  特征抽取  特征降维  散度差  奇异值分解

Method of linear feature extraction based on scatter difference in text categorization
LIU Hai-feng,WANG Yuan-yuan,YAO Ze-qing,ZHANG Shu-zu. Method of linear feature extraction based on scatter difference in text categorization[J]. Computer Engineering and Design, 2009, 30(7)
Authors:LIU Hai-feng  WANG Yuan-yuan  YAO Ze-qing  ZHANG Shu-zu
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号