首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于网格索引的数据聚类算法
引用本文:李筠,宋凯,姜学军.一种基于网格索引的数据聚类算法[J].计算机工程与应用,2008,44(16):139-141.
作者姓名:李筠  宋凯  姜学军
作者单位:沈阳理工大学,信息科学与工程学院,沈阳,110168
基金项目:国家高技术研究发展计划(863计划) , 辽宁省教育厅资助项目
摘    要:为了提高基于密度聚类算法的效率,避免算法在执行过程中的多余搜索,提出了一种基于DBSCAN算法的改进的空间数据聚类算法。该算法采用对象邻域空间进行划分的方法,将网格索引结构应用于该算法。在核心对象的邻域内选择八个方向上未标记且距离核心对象最边缘的对象来扩展种子对象,减少查询次数,降低聚类的时间复杂度。在实验中,利用海量数据集对算法进行测试,测试结果证明新算法在保证聚类精度的情况下时间效率显著高于DBSCAN算法。

关 键 词:DBSCAN  网格索引  空间数据  聚类
文章编号:1002-8331(2008)16-0139-03
收稿时间:2007-9-10
修稿时间:2007年9月10日

Data clustering algorithm based on index of gridding
LI Jun,SONG Kai,JIANG Xue-jan.Data clustering algorithm based on index of gridding[J].Computer Engineering and Applications,2008,44(16):139-141.
Authors:LI Jun  SONG Kai  JIANG Xue-jan
Affiliation:Information Science and Engineering College,Shenyang Ligong University,Shenyang 110168,China
Abstract:In order to improve the efficiency of clustering algorithm based on density and avoid redundant search in processing,the paper puts forward an improved spatial data clustering algorithm based on DBSCAN.The algorithm uses the method of object's neighborhood spatial segmentation,and makes use of index of gridding structure.In core points' neighborhood,the objects without mark which lie in eight aspects and have the biggest distance from core objects are chose to expand seed objects.In the case,the times of query is decreased,and the time complexity of clustering is reduced.In experiment,mass data is used to test the algorithm,which proves that the new algorithm's time efficiency is much better than DBSCAN in the same clustering precision.
Keywords:Density Based Spatial Clustering of Application with Noise(DBSCAN)  index of gridding  spatial data  clustering
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号