SVM文本分类中一种新的特征提取方法 |
| |
引用本文: | 姜鹤,陈丽亚. SVM文本分类中一种新的特征提取方法[J]. 计算机技术与发展, 2010, 20(3): 17-19,23 |
| |
作者姓名: | 姜鹤 陈丽亚 |
| |
作者单位: | 上海交通大学,电子信息与电气工程学院,上海,200240 |
| |
基金项目: | 上海科委项目,国家自然科学基金项目 |
| |
摘 要: | 随着互联网的迅速发展,面向重要网络媒体海量发布信息实现智能分类,对于网络信息监管、舆论引导工作有着深远的意义。文中针对在文本分类中的特征选取问题,描述了一种基于法矢量权重的特征评价和选取方法。将此方法与SVM学习算法进行结合,在路透社标准文本测试集上进行了对比评估。实验结果显示,此特征选取方法相对于传统的特征选取方法可以产生更优的分类性能。此特征提取方法提供一种有效的途径,在基本保持分类器性能的前提下显著地减少特征空间的维数,进而提升系统的资源利用效率。
|
关 键 词: | 文本分类 特征提取 支持向量机 资源受限 |
A New Feature Selection Method in SVM Text Categorization |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|