首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的k-means初始聚类中心选取算法
引用本文:韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152.
作者姓名:韩凌波  王强  蒋正锋  郝志强
作者单位:1. 中共湛江市委党校,理论信息室,广东,湛江,524032
2. 广西师范大学,计算机科学与信息工程学院,广西,桂林,541004
基金项目:国家自然科学基金,广西科学基金,广西研究生教育创新计划项目 
摘    要:在传统的k-means聚类算法中,聚类结果会随着初始聚类中心点的不同而波动,针对这个缺点,提出一种优化初始聚类中心的算法。该算法通过计算每个数据对象的密度参数,然后选取k个处于高密度分布的点作为初始聚类中心。实验表明,在聚类类别数给定的情况下,通过用标准的UCI数据库进行实验比较,发现采用改进后方法选取的初始类中心的k-means算法比随机选取初始聚类中心算法有相对较高的准确率和稳定性。

关 键 词:k-means算法  聚类中心  密度参数
收稿时间:2008-11-28
修稿时间:2009-2-27  

Improved k-means initial clustering center selection algorithm
HAN Ling-bo,WANG Qiang,JIANG Zheng-feng,HAO Zhi-qiang.Improved k-means initial clustering center selection algorithm[J].Computer Engineering and Applications,2010,46(17):150-152.
Authors:HAN Ling-bo  WANG Qiang  JIANG Zheng-feng  HAO Zhi-qiang
Affiliation:1.Department of Theory and Information,Zhanjiang Party Institute,Zhanjiang,Guangdong 524032,China; 2.College of Computer Science and Information Technology,Guangxi Normal University,Guilin,Guangxi 541004,China )
Abstract:The traditional k-means has sensitivity to the initial clustering center.Considering this defection,a new improved algorithm is proposed.In the new algorithm,the density parameter of every data object is computed,and then k data objects with high density parameter are chosen as the initial clustering centers.Given the cluster number,and UCI database is used as testing datasets.The clustering results demonstrate that the improved algorithm can enhance the clustering stability and accuracy of ordinary k-means algorithm relatively.
Keywords:k-means algorithm  clustering center  density parameter
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号