首页 | 本学科首页   官方微博 | 高级检索  
     

SVM文本分类中一种新的特征提取方法
引用本文:姜鹤,陈丽亚. SVM文本分类中一种新的特征提取方法[J]. 微机发展, 2010, 0(3): 17-19,23
作者姓名:姜鹤  陈丽亚
作者单位:上海交通大学电子信息与电气工程学院;
基金项目:上海科委项目(08511501902); 国家自然科学基金项目(60672068)
摘    要:随着互联网的迅速发展,面向重要网络媒体海量发布信息实现智能分类,对于网络信息监管、舆论引导工作有着深远的意义。文中针对在文本分类中的特征选取问题,描述了一种基于法矢量权重的特征评价和选取方法。将此方法与SVM学习算法进行结合,在路透社标准文本测试集上进行了对比评估。实验结果显示,此特征选取方法相对于传统的特征选取方法可以产生更优的分类性能。此特征提取方法提供一种有效的途径,在基本保持分类器性能的前提下显著地减少特征空间的维数,进而提升系统的资源利用效率。

关 键 词:文本分类  特征提取  支持向量机  资源受限

A New Feature Selection Method in SVM Text Categorization
JIANG He,CHEN Li-ya. A New Feature Selection Method in SVM Text Categorization[J]. Microcomputer Development, 2010, 0(3): 17-19,23
Authors:JIANG He  CHEN Li-ya
Affiliation:JIANG He,CHEN Li-ya(School of Information , Communication Engineering,Shanghai Jiaotong University,Shanghai 200240,China)
Abstract:With the rapid development of Internet,it has momentous significance for the task of the surveillance and management of network and leading the public to carry out the intelligence classification of the massive amount of information that released by the important network medium.This paper describes a feature selection method based on the weight of normal from SVM model.Using this feature scoring method with SVM learning algorithm on standard Reuters test set to compare other traditional feature selection me...
Keywords:text categorization  feature selection  support vector machine  resource constraint  
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号