首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于时态密度的倾斜分布数据流聚类算法
引用本文:杨 宁,唐常杰,王 悦,陈 瑜,郑皎凌. 一种基于时态密度的倾斜分布数据流聚类算法[J]. 软件学报, 2010, 21(5): 1031-1041. DOI: 10.3724/SP.J.1001.2010.03470
作者姓名:杨 宁  唐常杰  王 悦  陈 瑜  郑皎凌
作者单位:四川大学,计算机学院,四川,成都,610065
基金项目:国家自然科学基金,国家科技支撑计划 
摘    要:为解决倾斜分布的数据流聚类这一难题,提出了时态密度概念,给出其度量,揭示了其包括可增量计算在内的一系列数学性质;设计了时态密度树结构,提高了聚类时的存储和检索效率;设计了能够以实时或异步方式捕捉数据倾斜分布的数据流时态特征的聚类算法TDCA(temporal density based clustering algorithm),其时间复杂度为O(c(m(lgm).实验结果表明,该算法不仅有较强的功能,而且具有较好的规模可伸缩性.

关 键 词:数据流聚类  时态密度  倾斜分布
收稿时间:2008-02-25
修稿时间:2008-10-07

Clustering Algorithm on Data Stream with Skew Distribution Based on Temporal Density
YANG Ning,TANG Chang-Jie,WANG Yue,CHEN Yu and ZHENG Jiao-Ling. Clustering Algorithm on Data Stream with Skew Distribution Based on Temporal Density[J]. Journal of Software, 2010, 21(5): 1031-1041. DOI: 10.3724/SP.J.1001.2010.03470
Authors:YANG Ning  TANG Chang-Jie  WANG Yue  CHEN Yu  ZHENG Jiao-Ling
Affiliation:YANG Ning+,TANG Chang-Jie,WANG Yue,CHEN Yu,ZHENG Jiao-Ling(College of Computer Science,Sichuan University,Chengdu 610065,China)
Abstract:To solve the problem of clustering this paper proposes a concept of temporal density, which reveals aset of mathematical properties, especially the incremental computation. A clustering algorithm named TDCA(temporal density based clustering algorithm) with time complexity of O(c×m×lgm) is created with a tree structure implemented for both storage and retrieve efficiency. TDCA is capable of capturing the temporal features of a data stream with skew data distribution either in real time or on demand. The experimental results show that TDCA is functionable and scalable.
Keywords:data stream clustering  temporal density  skew distribution  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号