首页 | 本学科首页   官方微博 | 高级检索  
     

基于约束信息的并行k-means算法
引用本文:於跃成,王建东,郑关胜,陈斌.基于约束信息的并行k-means算法[J].Canadian Metallurgical Quarterly,2011,41(3).
作者姓名:於跃成  王建东  郑关胜  陈斌
作者单位:1. 南京航空航天大学信息科学与技术学院,南京,210016;江苏科技大学计算机科学与工程学院,镇江,212003
2. 南京航空航天大学信息科学与技术学院,南京,210016
基金项目:国家高技术研究发展计划(863计划)资助项目,国家自然科学基金
摘    要:为获得分布式数据集上用户所期望的聚类结果,提出了基于约束信息的并行k-means聚类算法.在分析并行k-means能够有效实现对水平分布式数据集进行聚类的基础上,修改并行k-means算法的目标函数,设计约束并行k-means算法,将站点用户的约束信息以chunklet的形式引入到分布式聚类过程,从而引导算法执行有偏搜索.约束并行k-means算法在理论上保证无约束样本簇内距离最小的同时能够确保chunklet约束中的样本与对应的簇中心之间的平均距离最小.实验结果表明,约束并行k-means算法能够有效改善并行k-means的聚类精度,同时在分布式环境下能够得到与已有约束聚类算法在集中式数据集上相等价的聚类结果.

关 键 词:k-means  并行k-means  约束聚类  约束并行k-means

Parallel k-means algorithm based on constrained information
Yu Yuecheng,Wang Jiandong,Zheng Guansheng,Chen Bin.Parallel k-means algorithm based on constrained information[J].Canadian Metallurgical Quarterly,2011,41(3).
Authors:Yu Yuecheng  Wang Jiandong  Zheng Guansheng  Chen Bin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号