首页 | 本学科首页   官方微博 | 高级检索  
     

大规模数据集下基于DBSCAN算法的增量并行化快速聚类
作者单位:;1.中南大学信息科学与工程学院;2.福建师范大学数学与信息学院;3.福建工程学院福建省汽车电子与电驱动技术重点实验室
摘    要:时空轨迹数据挖掘是发现移动对象行为模式的重要方式。针对海量轨迹数据处理的需求,提出一种增量并行化快速聚类算法。算法基于数据点的数量采用二分法对空间网格分区,结合贪心算法弹性重组分区,合理进行数据划分;进行本地局部聚类,获得合并簇候选集;采用R*-tree索引候选簇进行合并判断并处理;建立合并簇的无向无环图模型,并进行数据的全局重标签。实验结果表明:算法的弹性分区处理能有效地减少噪点数据,提高局部聚类的质量,采用R*-tree索引结构的合并策略有效提高了聚类的时间效率,聚类效果好,能实现大规模数据的在线处理。

关 键 词:大数据  DBSCAN  均衡划分  增量  并行化

INCREMENTAL PARALLELIZATION OF FAST CLUSTERING BASED ON DBSCAN ALGORITHM UNDER LARGE-SCALE DATA SET
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号