首页 | 本学科首页   官方微博 | 高级检索  
     

基于FPMAX的最大频繁项目集挖掘改进算法
引用本文:牛新征,佘堃. 基于FPMAX的最大频繁项目集挖掘改进算法[J]. 计算机科学, 2013, 40(12): 223-228
作者姓名:牛新征  佘堃
作者单位:电子科技大学计算机科学与工程学院 成都611731;电子科技大学计算机科学与工程学院 成都611731
基金项目:本文受国家自然科学基金(61300192),四川省科技厅科技支撑计划项目(2012GZ0061),中央高校基本科研业务费电子科技大学项目(ZYGX2010J075)资助
摘    要:挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree构造开销。而且在支持度较低时,FPMAX则会因用于超集检测的全局MFI-tree较为庞大而导致超集检测的性能下降。为此提出FPMAX的改进算法FPMAX-reduce,其通过采用基于事务共同后缀的前瞻剪枝策略来减少挖掘过程中的冗余递归过程。 当递归过程中产生的新条件FP-tree规模较小时,FPMAX-reduce通过构造条件MFI-tree来减小后续超集检测遍历的开销。性能试验表明,FPMAX-reduce算法通过有效的前瞻剪枝,在稠密事务数据库以及低支持度的情况下至多可将递归过程减少至原算法的一半以下,进而有效地提高了FPMAX算法的效率。

关 键 词:频繁项目集  最大频繁项目集  FP-tree  FPMAX  FP-growth 中图法分类号TP391文献标识码A
收稿时间:2013-03-24
修稿时间:2013-06-12

Mining Maximal Frequent Item Sets with Improved Algorithm of FPMAX
NIU Xin-zheng and SHE Kun. Mining Maximal Frequent Item Sets with Improved Algorithm of FPMAX[J]. Computer Science, 2013, 40(12): 223-228
Authors:NIU Xin-zheng and SHE Kun
Affiliation:School of Computer Science and Engineering,University of Electronic Science and Technology of China,Chengdu 611731,China;School of Computer Science and Engineering,University of Electronic Science and Technology of China,Chengdu 611731,China
Abstract:
Keywords:Frequent itemset  Maximal frequent itemset  FP-tree  FPMAX  FP-growth
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号