首页 | 本学科首页   官方微博 | 高级检索  
     

均衡时空挖掘数据流中频繁项集
引用本文:宋奎勇,任永功,寇香霞.均衡时空挖掘数据流中频繁项集[J].计算机科学,2011,38(12):187-190.
作者姓名:宋奎勇  任永功  寇香霞
作者单位:辽宁师范大学计算机与信息技术学院 大连116029
基金项目:国家自然科学基金(60603047); 辽宁省科技计划项目(2008216014); 大连市优秀青年科技人才基金(2008J23JH026); 教育部留学回国人员科研启动基金项目资助
摘    要:数据流具有流动性、连续性以及项分布不均衡性等特点,挖掘数据流中频繁项集是一项意义重大且具有挑战性的工作。提出一种均衡时空挖掘数据流中频繁项集算法—Bala_ Tree, Bala_ Tree实现一遍扫描数据流、快速簇更新、周期树结构重构以及基于经典算法挖掘频繁项集。实验表明,此算法能快速扫描和更新数据,合理利用内存以及精确获得频繁项集,Ba1a_Tree算法优于其他同类算法。

关 键 词:数据流,频繁项集,均衡,Bala_Tree

Balanced Space-time Frequent Itemsets Mining over Data Stream
SONG Kui-yong,REN Yong-gong,KOU Xiang-xia.Balanced Space-time Frequent Itemsets Mining over Data Stream[J].Computer Science,2011,38(12):187-190.
Authors:SONG Kui-yong  REN Yong-gong  KOU Xiang-xia
Affiliation:SONG Kui-yong REN Yong-gong KOU Xiang-xia(School of Computer and Infomation Technology,Liaoning Normal University,Dalian 116029,China)
Abstract:Data stream has characteristics of the flow, continuity, and the unbalanced distribution of item Minging frequent itemsets over data stream is a significant and challenging work. Presented a balanced space-time algorithm for mining frequent itemsets over data stream-Bala_Tree. The algorithm can only scan data stream once, make rapid cluster updates, periodical tree reconstruction and mine frequent itemsets based on classical algorithm. Experiments show that the algorithm can quickly scan and update data, realize the rational use of memory, accurate access to frectuent itemsets. Bala_ Tree algorithm is superior to other algorithms.
Keywords:Data stream  Frequent itemsets  Balance  Bala_ Tree
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号