首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的文本特征选择方法的研究与设计
引用本文:许高建,路遥,胡学钢,涂立静.一种改进的文本特征选择方法的研究与设计[J].苏州大学学报(工科版),2008,28(2):18-22.
作者姓名:许高建  路遥  胡学钢  涂立静
作者单位:1. 安徽农业大学信息与计算机学院,安徽,合肥,230036
2. 合肥工业大学计算机与信息学院,安徽,合肥,230009
基金项目:安徽省高校省级自然科学基金
摘    要:特征选择是文本挖掘技术的一个重要环节。在中文分词的基础上,通过设计一个简单的应用程序,对文本进行预处理。然后,在分析比较几种用于文本分类的特征选择方法的基础上,提出了一种基于信息增益和互信息相结合的特征选择方法。利用它对文本文档进行特征选择,抽取代表其特征的元数据或特征词条构成特征向量,降低噪音。最后通过实验来和其他几种特征选择方法作比较,分析这种方法获取文本特征的精度。

关 键 词:文本挖掘  信息增益  互信息  特征向量
文章编号:1673-047X(2008)02-0018-05
修稿时间:2007年10月12

Research and Design of an Improved Text-Feature-Selection Method
Xu Gaojian,Lu Yao,Hu Xuegang,Tu Lijing.Research and Design of an Improved Text-Feature-Selection Method[J].Journal of Suzhou University(Engineering Science Edition),2008,28(2):18-22.
Authors:Xu Gaojian  Lu Yao  Hu Xuegang  Tu Lijing
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号