首页 | 本学科首页   官方微博 | 高级检索  
     

集群环境下的并行聚类算法
引用本文:周兵,沈钧毅,彭勤科. 集群环境下的并行聚类算法[J]. 计算机工程, 2004, 30(4): 4-6
作者姓名:周兵  沈钧毅  彭勤科
作者单位:西安交通大学软件所,西安,710049;西安交通大学系统所,西安,710049
基金项目:国家自然科学基金资助项目(60173058)
摘    要:探讨在集群环境下,如何设计并行聚类算法。作为一种低成本、通用并行系统,集群系统的通信能力,相对于节点的计算能力,是一个瓶颈。所以在集群环境下,设计并行聚类算法时,应采用数据并行的思想。从理论上,对采用数据并行思想后,影响聚类算法的加速比和聚类质量的因素进行了分析,然后通过一个验证算法PCIT(Parallel clustering algorithm based on Index Tree)证实了理论分析的正确性。研究结果可以为以后设计更好的数据并行聚类算法提供理论依据。

关 键 词:数据挖掘  并行聚类  集群  通信  数据并行
文章编号:1000-3428(2004)04-0004-03
修稿时间:2003-03-27

Parallel Clustering Algorithm for PCs Cluster
ZHOU Bing,SHEN Junyi,PENG Qinke. Parallel Clustering Algorithm for PCs Cluster[J]. Computer Engineering, 2004, 30(4): 4-6
Authors:ZHOU Bing  SHEN Junyi  PENG Qinke
Affiliation:ZHOU Bing1,SHEN Junyi1,PENG Qinke2
Abstract:The goal of this paper is to discuss how to design a parallel clustering algorithm for PCs cluster. As a kind of low-cost all-purpose parallel computing system, the bottleneck of PCs cluster is the communication ability compared to the computing ability. This paper proposes the idea of adopting data parallelism when designing a parallel clustering algorithm for PCs cluster. The paper theoretically analyzes the influence on the speedup and the quality of clustering firstly. And then it uses the experimental result of an algorithm named PCIT(parallel clustering algorithm based on index tree), to prove the correctness of the theoretical analysis. This theoretical analysis will be helpful to design better parallel clustering algorithm for PCs cluster.
Keywords:Data mining  Parallel clustering  PCs cluster  Communication  Data parallelism  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号