首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于滑动窗口的流数据聚类算法
引用本文:蔡妮明,王翰虎,陈梅.一种基于滑动窗口的流数据聚类算法[J].计算机技术与发展,2011,21(1).
作者姓名:蔡妮明  王翰虎  陈梅
作者单位:贵州大学计算机科学与信息学院,贵州贵阳,550025
基金项目:贵州省科技计划工业攻关基金资助项目
摘    要:在实际应用中,人们往往比较关心最近一段时间内数据流的分布状况.在传统的基于界标模型的聚类算法CluStream中,没有淘汰过期元组,不能准确反映当前数据流的数据分布状况.滑动窗口是数据流中一种关注近期数据的近似方法.为了提高对流数据聚类分析的质量及效率,对算法clustream进行了改进,采用滑动窗口来支持数据处理.为了减少聚类操作中每次迭代的计算次数,算法采用改进的k-means来执行聚类操作.优化后的算法能及时淘汰过期元组,同时对新到达的元组不断进行实时处理,可以获得更准确的分析结果.与聚类算法CluStream相比,优化算法可获得较小的内存开销和快速的数据处理能力,聚类结果更合理清晰.

关 键 词:流数据  聚类  滑动窗口  改进的k-means算法

A New Streaming Data Cluster Algorithm Based on Sliding Window
CAI Ni-ming,WANG Han-hu,CHEN Mei.A New Streaming Data Cluster Algorithm Based on Sliding Window[J].Computer Technology and Development,2011,21(1).
Authors:CAI Ni-ming  WANG Han-hu  CHEN Mei
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号