首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于Hash函数抽样的数据流聚类算法
引用本文:张驹,黄汉永,肖杰.一种基于Hash函数抽样的数据流聚类算法[J].计算机系统应用,2009,18(3):73-75.
作者姓名:张驹  黄汉永  肖杰
作者单位:中南大学,信息科学与工程学院,湖南,长沙,410083
摘    要:近几年来由于数据流应用的大量涌现,基于数据流的数据挖掘算法已成为重要的研究课题,而现有的数据流聚类算法Clustream算法存在效率低,对大数据集适应性差等严重不足,本文提出了一种基于Hash函数抽样的数据流聚类算法。算法采用等时间跨度滑动窗口的思想,对每个窗口内的数据首先用Hash函数进行抽样,抽样后的数据先保存在存储池中,然后分析样本数据的变化情况,再利用PAM算法得到最终的聚类结果。从对真实数据集的实验结果上来看,算法具有良好的可行性和有效性,且在大规模数据处理的情况下,效率远高于Clustream

关 键 词:数据流聚类  抽样  Hash函数  滑动窗口  存储池
收稿时间:9/6/2008 12:00:00 AM

A DataStream Clustering Algorithm Based on Hash Sampling
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号