首页 | 本学科首页   官方微博 | 高级检索  
     

基于数据分区的并行DBSCAN算法
引用本文:何中胜,刘宗田,庄燕滨.基于数据分区的并行DBSCAN算法[J].小型微型计算机系统,2006,27(1):114-116.
作者姓名:何中胜  刘宗田  庄燕滨
作者单位:1. 常州工学院,计算机信息工程学院,江苏,常州,213002
2. 上海大学,计算机科学与工程学院,上海,200072
基金项目:中国科学院资助项目;江苏省建设厅科研项目
摘    要:DBSCAN是基于密度的聚类算法的一个典型代表算法,它对空间数据库聚类有很好的性能.然而,在对大规模数据库聚类时,DBSCAN需要大量内存支持并伴随着I/O开销.随着高性能计算机的发展,特别是集群式计算机出现,给我们提供了一种解决DBSCAN算法缺陷的方法,本文提出一种建立在集群式高性能计算机上基于数据分区并行DBSCAN算法.测试结果表明,它极大地降低了DBSCAN对时间和空间的需要.

关 键 词:大规模数据库  聚类  数据分区  DBSCAN算法  并行计算  消息传送
文章编号:1000-1220(2006)01-0114-03
收稿时间:2004-08-16
修稿时间:2004-08-16

Data-Partitioning-Based Parellel DBSCAN Algorithm
HE Zhong-sheng,LIU Zong-tian,ZHUANG Yan-bin.Data-Partitioning-Based Parellel DBSCAN Algorithm[J].Mini-micro Systems,2006,27(1):114-116.
Authors:HE Zhong-sheng  LIU Zong-tian  ZHUANG Yan-bin
Abstract:As an outstanding representative of clustering algorithms, DBSCAN algorithm show good performance in spatial data clustering. However, for large spatial databases, original DBSCAN requires large volume of memory support and could incur substantial I/O costs, with the rapid development of high performance computer, especially appearance of the cluster computers give a means to overcome the defect of original DBSCAN algorithm. In this article, we will propose a based-on cluster computering parallel DBSCAN algorthim. It is also a data-partitioning-based DBSCAN algorithm. Experimental results show that the new agrithom is superior to the original DBSCAN in efficiency.
Keywords:massive datasets  clustering  data-overlap-partition  DBSCAN algorithm  paraellel computing  message-passing
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号