首页 | 本学科首页   官方微博 | 高级检索  
     

基于k-means聚类算法的研究
引用本文:黄韬,刘胜辉,谭艳娜. 基于k-means聚类算法的研究[J]. 计算机技术与发展, 2011, 21(7)
作者姓名:黄韬  刘胜辉  谭艳娜
作者单位:哈尔滨理工大学计算机科学与技术学院,黑龙江,哈尔滨,150080
基金项目:哈尔滨市后备带头人基金项目
摘    要:分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法.通过将对数据集的多次采样,选取最终较优的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响度大大降低;同时,在选取初始聚类中心后,对初值进行数据标准化处理,使聚类效果进一步提高.通过UCI数据集上的数据对新算法Hk-means进行检测,结果显示Hk-means算法比原始的k-means算法在聚类效果上有显著的提高,并对相关领域有借鉴意义.

关 键 词:数据挖掘  聚类算法  k-means算法

Research of Clustering Algorithm Based on K-means
HUANG Tao,LIU Sheng-hui,TAN Yan-na. Research of Clustering Algorithm Based on K-means[J]. Computer Technology and Development, 2011, 21(7)
Authors:HUANG Tao  LIU Sheng-hui  TAN Yan-na
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号