分布式K-means聚类算法研究与实现 |
| |
作者单位: | ;1.国网宁夏电力公司信息通信公司 |
| |
摘 要: | 随着互联网数据的指数级增长,传统的聚类算法面临许多新的问题和挑战。本文深入研究了基于Hadoop的分布式K-means聚类算法,给出了算法的设计方法和实现策略。在5个不同大小的数据集上的实验表明,与传统的K-means聚类算法相比,本文设计的算法具有较好的性能,可有效地应用于海量数据的分析和挖掘。
|
关 键 词: | 分布式计算 K-means 聚类 Canopy |
Research and Implementation of Distributed K-means Clustering Algorithm |
| |
Abstract: | |
| |
Keywords: | |
|
|