首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的基于密度的抽样聚类算法
引用本文:胡彩平,秦小麟.一种改进的基于密度的抽样聚类算法[J].中国图象图形学报,2007,12(11):2031-2036.
作者姓名:胡彩平  秦小麟
作者单位:南京航空航天大学信息科学与技术学院 南京210016
基金项目:国家自然科学基金;江苏省自然科学基金
摘    要:基于密度的聚类算法DBSCAN是一种有效的空间聚类算法,它能够发现任意形状的聚类并且有效地处理噪声。然而,DBSCAN算法也有一些缺点,例如,①在聚类时只考虑空间属性没有考虑非空间属性;②在对大规模空间数据库进行聚类分析时需要较大的内存支持和I/O消耗。为此,在分析DBSCAN算法不足的基础上,提出了一种改进的基于密度的抽样聚类(improved density-based spatial clustering algorithm with sampling,IDBSCAS)算法,使之能够有效地处理大规模空间数据库,并且它不仅考虑了空间属性也考虑了非空间属性。2维空间数据的测试结果表明,该算法是可行、有效的。

关 键 词:空间数据挖掘  空间聚类  密度  种子  非空间属性
文章编号:1006-8961(2007)11-2031-06
修稿时间:2006-04-13

An Improved Density-based Spatial Clustering Algorithm with Sampling
HU Cai-ping,QIN Xiao-lin and HU Cai-ping,QIN Xiao-lin.An Improved Density-based Spatial Clustering Algorithm with Sampling[J].Journal of Image and Graphics,2007,12(11):2031-2036.
Authors:HU Cai-ping  QIN Xiao-lin and HU Cai-ping  QIN Xiao-lin
Abstract:DBSCAN is one of the effective spatial clustering algorithms,which can discover clusters of any arbitrary shape and handle the noise effectively.However,it has also several disadvantages.First,it is based on only spatial attributes without considering non-spatial attributes in the databases.Second,when DBSCAN handles large-scale spatial databases,it requires large volume of memory support and I/O cost.In this paper,an improved density-based spatial clustering algorithm with sampling(IDBSCAS) is developed,which not only clusters large-scale spatial databases effectively,but also considers spatial attributes and non-spatial attributes.Experimental results of 2-D spatial datasets show that the new algorithm is feasible and efficient.
Keywords:spatial data mining  spatial clustering  density  seeds  non-spatial attributes
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中国图象图形学报》浏览原始摘要信息
点击此处可从《中国图象图形学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号