首页 | 本学科首页   官方微博 | 高级检索  
     

面向实时海量数据流的数据聚类
引用本文:赵金东,于彦伟,刘惊雷.面向实时海量数据流的数据聚类[J].北京邮电大学学报,2016,39(3):114-119.
作者姓名:赵金东  于彦伟  刘惊雷
作者单位:烟台大学 计算机与控制工程学院, 山东 烟台 264005
基金项目:国家自然科学基金项目(61403328;61572419),山东省自然科学基金项目(ZR2013FM011)
摘    要:针对海量实时数据流,提出了一种基于密度和网格划分相结合的聚类算法.首先对数据空间进行划分,判断每个单元格中数据点的属性.如果单元格内数据点密度高于阈值,则判定这些点为核心点;否则,根据单元格邻居内数据点的数量对数据点进行再次判断,以确定单元格内的数据点是边界点还是噪声点.算法克服了基于密度的算法运行效率低的缺点,又弥补了基于网格的算法精度较低的不足.通过实验验证了算法的效率和性能,并与经典的DBSCAN和CLIQUE算法进行了对比分析.最后分析了算法在面向海量实时数据流方面所具有的优势,并提出了进一步的研究方向.

关 键 词:异常检测  聚类分析  密度聚类  网格聚类  海量数据流  
收稿时间:2015-06-25

A Data Clustering Algorithm over Real Time High-Volume Data Streams
ZHAO Jin-dong,YU Yan-wei,LIU Jing-lei.A Data Clustering Algorithm over Real Time High-Volume Data Streams[J].Journal of Beijing University of Posts and Telecommunications,2016,39(3):114-119.
Authors:ZHAO Jin-dong  YU Yan-wei  LIU Jing-lei
Affiliation:Computer and Control Engineering College, Yantai University, Shandong Yantai 264005, China
Abstract:The energy efficient and real-time data collecting problem in wireless sensor network was stud-ied. The mobile data collecting protocol consists four phases: nodes clustering, routes planning, routes combine and data collecting is proposed. Two heuristic algorithms save and nearest neighbor were presen-ted to build data collecting routes which incur the least mobile cost while satisfy the deadline constraint. Simulations show that the proposed heuristic routes planning algorithms have good performance in terms of energy saving, deadline guarantee and travel cost reduction.
Keywords:outlier detection  clustering analysis  density-based cluster  partition-based cluster  high-volume data stream
本文献已被 万方数据 等数据库收录!
点击此处可从《北京邮电大学学报》浏览原始摘要信息
点击此处可从《北京邮电大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号