首页 | 本学科首页   官方微博 | 高级检索  
     

文本分类中一种混合型特征降维方法
引用本文:刘海峰,王元元,姚泽清,张述祖.文本分类中一种混合型特征降维方法[J].计算机工程,2009,35(2):194-196.
作者姓名:刘海峰  王元元  姚泽清  张述祖
作者单位:1. 解放军理工大学指挥自动化学院,南京,210007;解放军理工大学理学院,南京,210007
2. 解放军理工大学指挥自动化学院,南京,210007
3. 解放军理工大学理学院,南京,210007
摘    要:提出一种基于特征选择和特征抽取的混合型文本特征降维方法,分析基于选择和抽取的特征降维方法各自的特点,借助特征项的类别分布差异信息对特征集进行初步选择。使用一种新的基于PCA的特征抽取方法对剩余特征集进行二次抽取,在最大限度减少信息损失的前提下实现了文本特征的有效降维。对文本的分类实验结果表明,该特征降维方法具有良好的分类效果。

关 键 词:文本分类  特征选择  特征抽取  主成分分析
修稿时间: 

Mixed Method of Reducing Feature in Text Classification
LIU Hai-feng,WANG Yuan-yuan,YAO Ze-qing,ZHANG Shu-zu.Mixed Method of Reducing Feature in Text Classification[J].Computer Engineering,2009,35(2):194-196.
Authors:LIU Hai-feng  WANG Yuan-yuan  YAO Ze-qing  ZHANG Shu-zu
Affiliation:1.Institute of Command Automation;PLA University of Science and Technology;Nanjing 210007;2.Institute of Sciences;Nanjing 210007
Abstract:A mixed method of reducing the text features based on feature selection and feature extraction is brought forward.The characteristics about feature selection and feature extraction are analyzed.Some features are chosen by using the sort distribution information.And a new way based on Principle Component Analysis(PCA)is used to extract the surplus features and realize the compression of features twice.In the precondition of the information loss least,the text feature decrease smart is completed.Test results ...
Keywords:text classification  feature selection  feature extraction  Principle Component Analysis(PCA)
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号