首页 | 本学科首页   官方微博 | 高级检索  
     

基于滑动窗口的XML数据流聚类算法
引用本文:姚文集,高明霞,毛国君,李广奎.基于滑动窗口的XML数据流聚类算法[J].计算机工程,2010,36(13):87-89,92.
作者姓名:姚文集  高明霞  毛国君  李广奎
作者单位:北京工业大学计算机学院,北京,100124
基金项目:国家自然科学基金资助项目"分布式数据流的集成模式挖掘模型和概念漂移检测算法研究",北京工业大学博士启动基金资助项目 
摘    要:通过对XML数据流的聚类研究,提出一种基于滑动窗口的XML数据流聚类算法SW-XSCLS。该算法采用滑动窗口技术,以聚类特征指数直方图作为概要数据结构,能动态地淘汰“过时”的数据,较好地保存当前窗口内的数据分布状况,从而获取较高质量的聚类结果。理论分析和实验结果表明,该算法可以获得较高的聚类质量和较快的处理速度。

关 键 词:XML数据流  滑动窗口  聚类  指数直方图

XML Data Stream Clustering Algorithm Based on Sliding Window
YAO Wen-ji,GAO Ming-xia,MAO Guo-jun,LI Guang-kui.XML Data Stream Clustering Algorithm Based on Sliding Window[J].Computer Engineering,2010,36(13):87-89,92.
Authors:YAO Wen-ji  GAO Ming-xia  MAO Guo-jun  LI Guang-kui
Affiliation:(School of Computer, Beijing University of Technology, Beijing 100124)
Abstract:This paper proposes a XML data stream clustering algorithm SW-XSCLS, based on sliding window, in the view of the XML data stream clustering research. The algorithm uses the sliding window technology, takes Exponential Histogram of Clustering Feature(EHCF) as its summary of data structure, it can dynamicly eliminates the outdated data, better preservation of the data distribution in current window, so can obtain a higher quality of clustering results. Theoretical analysis and experimental result show that the algorithm can obtain the higher clustering quality and the quicker processing speed.
Keywords:XML data stream  sliding window  clustering  exponential histogram
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号