首页 | 本学科首页   官方微博 | 高级检索  
     

新的K-均值算法最佳聚类数确定方法
引用本文:周世兵,徐振源,唐旭清. 新的K-均值算法最佳聚类数确定方法[J]. 计算机工程与应用, 2010, 46(16): 27-31. DOI: 10.3778/j.issn.1002-8331.2010.16.008
作者姓名:周世兵  徐振源  唐旭清
作者单位:1. 江南大学信息工程学院,江苏,无锡,214122
2. 江南大学信息工程学院,江苏,无锡,214122;江南大学理学院,江苏,无锡,214122
3. 江南大学理学院,江苏,无锡,214122
基金项目:国家高技术研究发展计划(863计划),国家自然科学基金 
摘    要:K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。

关 键 词:K-均值聚类  聚类数  聚类有效性指标  初始聚类中心
收稿时间:2010-01-05
修稿时间:2010-3-26 

New method for determining optimal number of clusters in K-means clustering algorithm
ZHOU Shi-bing,XU Zhen-yuan,TANG Xu-qing. New method for determining optimal number of clusters in K-means clustering algorithm[J]. Computer Engineering and Applications, 2010, 46(16): 27-31. DOI: 10.3778/j.issn.1002-8331.2010.16.008
Authors:ZHOU Shi-bing  XU Zhen-yuan  TANG Xu-qing
Affiliation:1.School of Information Technology,Jiangnan University,Wuxi,Jiangsu 214122,China 2.School of Science,Jiangnan University,Wuxi,Jiangsu 214122,China
Abstract:K-means clustering algorithm clusters datasets on the premise that the number of clusters is certain and initial clustering centers are selected randomly.In general the value of k cann't be confirmed beforehand,and randomly selected initial clustering centers make the result of clustering unstable.A new method for determining optimal number of clusters in K-means clustering algorithm is presented to analyze the clustering quality and determine optimal number of clusters through making the number of clusters produced by AP be the upper limit kmax of search range for the number of clusters,selecting the Silhouette validity index and setting initial clustering centers based on maximum and minimum distance algorithm.Simulation experiment and analysis demonstrate the feasibility of the above-mentioned algorithm.
Keywords:K-means clustering  number of clusters  clustering validity index  initial clustering centers
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号