首页 | 本学科首页   官方微博 | 高级检索  
     

余弦度量和适应度函数改进的聚类方法
引用本文:施侃晟,刘海涛,白英彩,宋文涛,洪亮亮. 余弦度量和适应度函数改进的聚类方法[J]. 电子科技大学学报(自然科学版), 2013, 42(4): 621-624. DOI: 10.3969/j.issn.1001-0548.2013.04.017
作者姓名:施侃晟  刘海涛  白英彩  宋文涛  洪亮亮
作者单位:1.上海交通大学电子与电气工程系 上海 徐汇区 200030;
基金项目:国家自然科学基金(61073150)
摘    要:K-均值算法因其简单和高效性, 在文本聚类中占有重要地位. 针对传统的K-均值算法对初始点敏感、易陷入局部最优的问题, 结合遗传算法已经成为一种趋势. 在充分发挥K-均值算法的高效性的同时, 该文利用遗传算法的全局自适应优化特点克服了对初始点敏感的问题. 同时, 以余弦度量评价对象间的相似性并以此构造新的遗传算法适应度函数、收敛准则以及遗传算法种群更新方式, 提高了K-均值和遗传算法这种结合方式的聚类精度, 并增强了该结合算法的稳定性.

关 键 词:遗传算法   适应度函数   K-均值算法   相似性度量   文本聚类
收稿时间:2011-08-29

Text Clustering Method with Improved Fitness Function and Cosine Similarity Measure
Affiliation:1.College of Electronic and Electric Engineering,Shanghai Jiaotong University Xuhui Shanghai 200030;2.China Incubating Center Hangzhou 310053
Abstract:The traditional K-means algorithm is widely used because of its simplicity and efficiency. However, it is sensitive to the initial point and easy to fall into local optimum. In this paper, we use cosine measure to evaluate the similarity between objects and construct a new fitness function of genetic algorithm and the new convergence criterion for K-means algorithm. Experimental results show that the new method enhances the clustering accuracy and stability for the combination of K-means and genetic algorithm.
Keywords:
点击此处可从《电子科技大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《电子科技大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号