首页 | 本学科首页   官方微博 | 高级检索  
     

文本分类中的特征抽取
引用本文:秦进,陈笑蓉,汪维家,陆汝占.文本分类中的特征抽取[J].计算机应用,2003,23(2):45-46.
作者姓名:秦进  陈笑蓉  汪维家  陆汝占
作者单位:1. 贵州大学,计算机科学系,贵州,贵阳,550025
2. 上海交通大学,计算机科学与工程系,上海,200030
基金项目:贵州省科学技术项目基金资助(993021)
摘    要:特征提取是用机器学习方法进行文本分类的重点和难点。文中比较了目前几种最常用的特征抽取方法,提出了一种改进型的互信息特征抽取方法,并在构建的实验系统中比较了这几种特征抽取方法,发现改进的特征抽取方法是有效可行的。

关 键 词:文本分类  特征抽取  信息处理  互信息  文本挖掘  机器学习
文章编号:1001-9081(2003)02-0045-02
修稿时间:2002年11月14

Feature Extraction in Text Categorization
Abstract:
Keywords:text categorization  feature extraction  mutual information
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号