首页 | 本学科首页   官方微博 | 高级检索  
     

基于数据取样的DBSCAN算法
引用本文:周水庚,范晔,周傲英.基于数据取样的DBSCAN算法[J].小型微型计算机系统,2000,21(12):1270-1274.
作者姓名:周水庚  范晔  周傲英
作者单位:复旦大学计算机科学系,上海,200433
基金项目:国家自然科学基金(项目编号69743001)和国家教委博士点基金的资助.
摘    要:取类是数据挖掘领域中的一个重要研究课题。聚类技术在许多领域有着广泛的应用,基于密度的聚类算法DBSCAN是一种有效的空间聚类算法,它能够发现任意形状的类并且有效地处理噪声,用户只需输入一个参数就可以进行聚类分析,但是,DBSCAN算法在对大规模空间数据库进行聚类分析时需要较大的内存支持和I/O消耗。本文在分析DBSCAN算法不足的基础上,提出一种基于数据取样的DBSCAN算法,使之能够有效地处理大规模空间数据库。二维空间数据测试结果表明本文算法是可行、有效的。

关 键 词:空间数据库  数据挖掘  DBSCAN算法  数据取样
文章编号:1000-1220(2000)12-1270-05

SDBSCAN :A SAMPLING-BASED DBSCAN ALGORITHM FOR LARGE-SCALE SPATIAL DATABASES
ZHOU Shui-geng,FAN Ye,ZHOU Ao-ying.SDBSCAN :A SAMPLING-BASED DBSCAN ALGORITHM FOR LARGE-SCALE SPATIAL DATABASES[J].Mini-micro Systems,2000,21(12):1270-1274.
Authors:ZHOU Shui-geng  FAN Ye  ZHOU Ao-ying
Abstract:Clustering, a useful technique for data mining, has promising applicati on perspective in many fields, such as pattern recognition, image processing and data compression etc. DBSCAN is a density-based clustering algorithm that can d iscover clusters of arbitrary shape and effectively handle noise, and requires o nly one input parameter. However, while dealing with large-scale databases, DBS C AN requires a lot of memory and can incur high I/O overhead. In this paper, we p resent a sampling-based DBSCAN algorithm(SDBSCAN)for clustering large-scale da tabases. Experimental results demonstrate that our algorithm is feasible and eff ective.
Keywords:Large scale database  Data mining  Clustering  Sampling  DBSCAN algorithm  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号