首页 | 本学科首页   官方微博 | 高级检索  
     

基于类信息的文本聚类中特征选择算法
引用本文:严莉莉,张燕平.基于类信息的文本聚类中特征选择算法[J].计算机工程与应用,2007,43(12):144-146,217.
作者姓名:严莉莉  张燕平
作者单位:安徽大学,智能计算与信号处理重点实验室,合肥,230039
基金项目:国家重点基础研究发展计划(973计划) , 安徽省自然科学基金 , 安徽省教育厅重点项目
摘    要:文本聚类属于无监督的学习方法,由于缺乏类信息还很难直接应用有监督的特征选择方法,因此提出了一种基于类信息的特征选择算法,此算法在密度聚类算法的聚类结果上使用信息增益特征选择法重新选择最有分类能力的特征,实验验证了算法的可行性和有效性。

关 键 词:文本聚类  特征选择  密度聚类算法
文章编号:1002-8331(2007)12-0144-03
修稿时间:2006-12

A class-based feature selection algorithm for test clustering
YAN Li-li,ZHANG Yan-ping.A class-based feature selection algorithm for test clustering[J].Computer Engineering and Applications,2007,43(12):144-146,217.
Authors:YAN Li-li  ZHANG Yan-ping
Affiliation:The Key Laboratory of Intelligence Computing and Signal Processing,Ministry of Education,Anhui University,Hefei 230039,China
Abstract:Test clustering is an unsupervised learning method.Some effective supervised feature selection methods can't be applied to it because of the unavailability of class information.So a new feature selection algorithm base on class information is put forward in this paper,which addresses the Information Gain method on density clustering results to select out the best small part of features.And the results show the feasibility and effectiveness of the algorithm.
Keywords:test clustering  feature selection  density clustering algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号