文本分类中的特征抽取 |
| |
引用本文: | 秦进,陈笑蓉,汪维家,陆汝占. 文本分类中的特征抽取[J]. 计算机应用, 2003, 23(2): 45-46 |
| |
作者姓名: | 秦进 陈笑蓉 汪维家 陆汝占 |
| |
作者单位: | 1. 贵州大学,计算机科学系,贵州,贵阳,550025 2. 上海交通大学,计算机科学与工程系,上海,200030 |
| |
基金项目: | 贵州省科学技术项目基金资助(993021) |
| |
摘 要: | 特征提取是用机器学习方法进行文本分类的重点和难点。文中比较了目前几种最常用的特征抽取方法,提出了一种改进型的互信息特征抽取方法,并在构建的实验系统中比较了这几种特征抽取方法,发现改进的特征抽取方法是有效可行的。
|
关 键 词: | 文本分类 特征抽取 信息处理 互信息 文本挖掘 机器学习 |
文章编号: | 1001-9081(2003)02-0045-02 |
修稿时间: | 2002-11-14 |
Feature Extraction in Text Categorization |
| |
Abstract: | |
| |
Keywords: | text categorization feature extraction mutual information |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|