首页 | 官方网站   微博 | 高级检索  
     

不产生候选的快速投影频繁模式树挖掘算法
引用本文:何炎祥,向剑文,朱骁峰,孔维强.不产生候选的快速投影频繁模式树挖掘算法[J].计算机科学,2002,29(11):71-75.
作者姓名:何炎祥  向剑文  朱骁峰  孔维强
作者单位:武汉大学计算机学院,软件工程国家重点实验室,武汉,430072
摘    要:1.概述近年来,对事务数据库、时序数据库和各种其它类型数据库中的频繁模式挖掘的研究越来越普及。许多先前的研究都是采用Apriori或类似的候选产生—检查迭代算法,使用候选项集来找频繁项集。这些算法都基于一种重要的反单调的Apriori性质:任何非频繁的(k—1)-项集都不可能是频繁k-项集的子集。因此,如果一个候选k-项集的(k—1)-子集不在频繁(k—1)-项集中,则该候选也不可能是频繁的,从而可

关 键 词:事务数据库  快速投影频繁模式树挖掘算法  数据挖掘  频繁项集

Mining Project Frequent Patterns without Candidate Generation
Abstract:Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns.In this study, we introduce a novel frequent pattern growth (FP-growth)method, which is efficient and scalable for mining both long and short frequent patterns without candidate generation. And build a new project frequent pattern growth (PFP-tree)algorithm on this study, which not only heirs all the advantages in the FP-growth method, but also avoids it's bottleneck in database size dependence. So increase algorithm's scalability efficiently.
Keywords:Data mining  Frequent patterns-tree  Frequent patterns-growth  Project frequent pattern-tree
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号