首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于ESEquivPS的封闭频繁项集挖掘算法
引用本文:白承森,马志新,徐玉生. 一种基于ESEquivPS的封闭频繁项集挖掘算法[J]. 计算机工程与科学, 2009, 31(1)
作者姓名:白承森  马志新  徐玉生
作者单位:兰州大学信息科学与工程学院,甘肃,兰州,730000;兰州大学信息科学与工程学院,甘肃,兰州,730000;兰州大学信息科学与工程学院,甘肃,兰州,730000
基金项目:广东省教育部产学研合作项目 
摘    要:本文提出一种基于ESEquivPS(扩展支持度相等性剪枝策略)的封闭频繁项集挖掘算法ECFIMA。该算法采用深度优先和广度优先相结合的策略访问搜索空间,使用垂直位图向量格式存储表示项集和事务数据库,同时利用基本剪枝策略、相等性剪枝策略、扩展支持度相等性剪枝策略1和扩展支持度相等性剪枝策略2进行候选空间剪枝,并采用多种不同特性的测试数据集进行实验。实验结果表明,ECFIMA算法是一种高效的封闭频繁项集挖掘算法,在多种测试数据集上性能都优于CHARM算法,尤其是在拥有大量长的封闭频繁项集的测试数据集上,效率比CHARM算法提高约2~3倍。

关 键 词:数据挖掘  封闭频繁项集  剪枝策略  搜索空间  扩展支持度

A New Algorithm for Mining Closed Frequent Itemsets Based on ESEquivPS
BAI Cheng-sen,MA Zhi-xin,XU Yu-sheng. A New Algorithm for Mining Closed Frequent Itemsets Based on ESEquivPS[J]. Computer Engineering & Science, 2009, 31(1)
Authors:BAI Cheng-sen  MA Zhi-xin  XU Yu-sheng
Affiliation:School of Information Science and Engineering;Lanzhou University;Lanzhou 730000;China
Abstract:This paper presents a new algorithm for mining closed frequent itemsets based on the extension support equivalency pruning strategy.It uses a combination way of DFS and BFS to enumerate the search space,and uses a vertical bitmap representation for databases and itemsets.It also applies BasicPS1,EquivPS,ESEquivPS1 and ESEquivPS2 to prune the search space.The experimental results show that ECFIMA is an efficient algorithm.It performs better than CHARM on different datasets.Especially on the dataset with a lo...
Keywords:data mining  closed frequency itemset  pruning strategy  search space  extension support  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号