首页 | 本学科首页   官方微博 | 高级检索  
     

基于B-list的最大频繁项集挖掘算法
引用本文:张昌,文凯,郑云俊. 基于B-list的最大频繁项集挖掘算法[J]. 计算机应用研究, 2019, 36(2)
作者姓名:张昌  文凯  郑云俊
作者单位:重庆邮电大学 通信与信息工程学院通信新技术应用研究中心,重庆,400065;重庆邮电大学 通信与信息工程学院通信新技术应用研究中心,重庆 400065;重庆信科设计有限公司,重庆 401121
摘    要:针对现有的最大频繁项集挖掘算法挖掘时间过长、内存消耗较大的问题,提出了一种基于构造链表B-list的最大频繁项集挖掘算法BMFI,该算法利用B-list数据结构来挖掘频繁项集并采用全序搜索树作为搜索空间,然后采用父等价剪枝技术来缩小搜索空间,最后再结合基于MFI-tree的投影策略实现超集检测来提高算法的效率。实验结果表明,BMFI算法在时间效率与空间效率方面均优于FPMAX算法与MFIN算法。该算法在稠密数据集与稀疏数据集中进行最大频繁项集挖掘时均有良好的效果。

关 键 词:最大频繁项集挖掘  深度优先搜索  剪枝技术  超集检测
收稿时间:2017-08-24
修稿时间:2018-12-29

Maximal frequent itemset mining algorithm based on B-list
Zhang Chang,wen kai and ZhengYunjun. Maximal frequent itemset mining algorithm based on B-list[J]. Application Research of Computers, 2019, 36(2)
Authors:Zhang Chang  wen kai  ZhengYunjun
Abstract:In order to solve the problems that existing in the maximal frequent itemset mining algorithms, such as the mining time is too long and the memory consumption is too large, this paper presents a maximal frequent itemset mining algorithm BMFI which employs B-list to mining frequent itemsets and employs the whole sequence search tree as the search space, then, the parent equivalence pruning technique is used to reduce the search space. Finally, which combined with the MFI-tree-based projection strategy to achieve superset detection to improve the efficiency of the algorithm. The experimental results show that the performance of BMFI algorithm is superior to FPMAX algorithm and MFIN algorithm in terms of time efficiency and spatial efficiency. The proposed algorithm has good performance when mining the maximal frequent itemset in dense data set and sparse data set.
Keywords:maximal frequent itemsets mining  depth-first search  pruning techniques  superset detection
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号