首页 | 本学科首页   官方微博 | 高级检索  
     

在线挖掘数据流闭合频繁项集CMNL-SW算法的研究
引用本文:汤春明,王培义. 在线挖掘数据流闭合频繁项集CMNL-SW算法的研究[J]. 数据采集与处理, 2012, 27(4)
作者姓名:汤春明  王培义
作者单位:哈尔滨工程大学信息与通信工程学院,哈尔滨工程大学信息与通信工程学院
摘    要:数据流快速无限的特点及其应用领域的不断扩增,使数据流的挖掘技术越来越具有挑战性。本文提出了一种新的CMNL-SW(Closed Map and Num List-Sliding Window)挖掘算法。具体使用数据结构Closed Map存储挖掘到的闭合项集和Num List存储所有不同项的序号,通过对添加新事务和删除旧事务包含的项序号进行简单的并集和该事务与之相关已经挖掘到的闭合项集进行交集运算来更新当前滑动窗口,使之能够根据用户任意指定的支持度阈值在线输出数据流上闭合频繁项集信息。通过理论分析和对真实数据集Mushroom、Retail-chain和人工合成数据集T40I10D100K的挖掘结果表明,提出的算法在时空效率上明显优于同类经典算法Moment和CFI-Stream,并且随着数据流上处理事务数的递增和快速改变有很好的稳定性。

关 键 词:CMNL-SW挖掘算法;闭合频繁项集;滑动窗口;数据流
收稿时间:2011-07-22
修稿时间:2011-09-28

CMNL-SW Algorithm Study on Online Mining Closed Frequent Itemsets over Data Stream
TANG Chunming and WANG Peiyi. CMNL-SW Algorithm Study on Online Mining Closed Frequent Itemsets over Data Stream[J]. Journal of Data Acquisition & Processing, 2012, 27(4)
Authors:TANG Chunming and WANG Peiyi
Affiliation:College of Information and Communication Engineering, Harbin Engineering University,College of Information and Communication Engineering, Harbin Engineering University
Abstract:
Keywords:CMNL-SW mining algorithm   closed frequent itemsets   sliding window   data stream
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号