期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于压缩FP-树和数组技术的频繁模式挖掘算法 总被引：2，自引：0，他引：2

秦亮曦苏永秀刘永彬梁碧珍《计算机研究与发展》2008,45(Z1):244-249

FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine. 一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法. 相似文献

2.

一种基于TFP树的频繁项集改进挖掘算法

董平胥杰苏力萍《微计算机信息》2007,23(33):139-140,97

FP-growth算法是一种被证明有效的频繁模式挖掘算法。但是由于在挖掘频繁模式时需要递归地生成大量的条件FP-树,其时空效率较低,本文针对这一问题,首先构造一种改进的TFP-树结构,然后在构造的TFP-tree基础上引入被约束子树提出一种基于TFP树的频繁项集的改进挖掘算法,并对该算法进行性能分析,结果证明该算法在运行速度得到很大提高。相似文献

3.

基于改进FP-树的最大项目集挖掘算法* 总被引：1，自引：0，他引：1

谢志强朱孟杰杨静《计算机应用研究》2009,26(2):502-505

挖掘最大频繁项目集是多种数据挖掘应用中的关键问题。FP-growth算法是目前最有效的频繁模式挖掘算法之一,其在挖掘最大项目集时要递归生成大量的条件FP-树,存在时空效率不高的问题。于是结合改进的FP-树,提出了一种快速挖掘最大项目集的算法。该算法利用改进的FP-树是单向的且每个节点只保留指向父节点的指针,可以节约大量的存储空间;同时引入项目序列集和它的基本操作,使挖掘最大频繁项目集时不生成含大量候选项目的集合或条件FP-树,可以快速地挖掘出所有的最大频繁项目集。实例分析证明所提出的算法是可行的。相似文献

4.

基于改进的FP-树和数组技术的频繁模式挖掘算法

孟志忠《电脑开发与应用》2012,25(9):43-45,51

FP-growth算法是目前较高效的频繁模式挖掘算法之一,该算法不产生候选项集,但递归构造“条件FP-Tree”的CPU 开销和存储很大.为此提出了一种频繁模式挖掘算法IFPmine.首先,为了节省内存空间,采用了约束子树的挖掘方法;其次,采用了数组技术来减少树的遍历时间,从而提高算法的效率.实验结果表明,IFP算法是一种较有效的频繁模式挖掘算法,其挖掘效率优于STFP-树算法和FP-树算法,而需要的内存却少于STFP-树和FP-树算法. 相似文献

5.

基于矩阵技术的频繁项目集挖掘算法

下载免费PDF全文

田王君蒋军辉陈士慧《计算机工程》2011,37(16):80-81

频繁模式挖掘算法FP-growth算法需递归地生成大量的条件FP-树,且耗费大量存储空间和时间。为此,采用矩阵技术统计约束子树中的频繁项集和频繁项集的支持度,以进行数据挖掘。实验结果表明,该频繁模式挖掘算法是有效的,具有较高的时间效率及空间效率。相似文献

6.

基于排序FP-树的频繁模式高效挖掘算法 总被引：11，自引：0，他引：11

秦亮曦李谦史忠植《计算机科学》2005,32(4):31-33

FP-growth算法是目前较高效的频繁模式挖掘算法之一。在FP-growth算法中,FP-树及条件FP-树的构造和遍历占了算法绝大部分的时间,如果能减少这方面的时间,则有望进一步改善算法的效率。本文给出了一个频繁模式挖掘算法SFP-growth。算法通过将FP-树有序化及采用高效排序算法等措施来提高FP-树构造的效率,从而使算法达到较高的效率。实验结果表明,SFP-growth是一个高效的频繁模式挖掘算法,其性能优于Apriori、Eclat和FP-growtn算法。相似文献

7.

SFP-Max--基于排序FP-树的最大频繁模式挖掘算法 总被引：11，自引：1，他引：11

秦亮曦史忠植《计算机研究与发展》2005,42(2):217-223

FP-growth算法是目前较高效的频繁模式挖掘算法之一，但将它用于最大频繁模式挖掘时却不能获得较高的效率．深入分析了造成低效的原因，提出了利用排序FP-树挖掘最大频繁模式的算法SFP-Max．算法的主要思想如下：①基于排序FP-树；②利用最大频繁模式的性质，减小产生的候选最大模式的规模；③设置中间结果集，缩小检验的范围，从而减少检验候选最大模式的时间．实验表明，SFP-Max是一个高效的最大频繁模式的挖掘算法，对于测试的数据集，SFP-Max的性能多数情况下都优于MAFIA算法．相似文献

8.

基于改进FP-树的最大模式挖掘算法 总被引：2，自引：0，他引：2

孟祥萍王华金王贤勇任纪川鞠传香《计算机工程与应用》2005,41(14):179-181,228

频繁模式挖掘是数据挖掘领域中的一个非常重要的分支,但是由于其内在的计算复杂性,挖掘密集型数据的频繁模式完全集非常困难而且数量往往大得惊人,难以理解和应用。最大频繁模式(最大模式)压缩隐含了所有的频繁模式,存储所占用的空间远远小于完全集,因而最大模式挖掘具有十分重要的意义。该文改进了传统的FP-树结构并提出了一种有效的基于改进FP-树的最大模式挖掘算法IFP-M ax;通过引入后缀子树的概念,算法在挖掘过程中不用生成最大频繁模式候选集,从而大大提高了算法的时间效率和空间可伸缩性。实验表明,IFP-M ax的挖掘速度比M AFIA和GenM ax大约快一个数量级。相似文献

9.

基于逆向FP-树的频繁模式挖掘算法 总被引：8，自引：0，他引：8

赵艳铎宋斌恒《计算机应用》2005,25(6):1385-1387

提出了一种称为逆向FP 合并的算法,该算法逆向构造FP 树并通过在其中寻找频繁扩展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP 增长算法,其中时间效率提高了2倍以上。此外,新算法还具有良好的伸缩性。相似文献

10.

用变异FP-树改进CLOSET算法

刘迎意吴春旭沈陵峰《计算机仿真》2010,27(3):98-101

频繁闭项集提供了频繁项集的一种完整、最小表示,对频繁闭项集的挖掘是近年来数据挖掘领域研究的热点,研究人员从不同角度对算法改进以提高算法的效率。基于频繁项集中共生项集的性质,提出无须进行子集检查的频繁闭项集挖掘方法,并设计一种变异的FP-树结构,利用FP-树结构来存储结点共生项集信息,以改进CLOSET算法,算法无须遍历结果集进行闭合性检查。实验表明,在支持度阈值减小,结果集变大时,改进算法的时间增长率比原有算法小。相似文献

11.

在单向FP—tree上挖掘最大频繁项集

宋晶晶姜保庆关丽霞《电脑与微电子技术》2010,(1):19-24

针对稠密数据集．提出一种基于单向FP—tree的最大频繁项集挖掘算法Unid_FP-Max2。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP—tree基础上用三个很小的数组来表示．因而避免了以往算法需递归构造条件FP—tree来计算最大频繁项集的弊端,极大的降低了内存空间和时间开销,提高了挖掘效率。实验表明,与FP—Max算法相比。算法的效率提高了1倍以上。相似文献

12.

在单向FP-tree上挖掘最大频繁项集

宋晶晶姜保庆关丽霞《现代计算机》2010,(1):19-24

针对稠密数据集．提出一种基于单向FP—tree的最大频繁项集挖掘算法Unid_FP-Max2。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP—tree基础上用三个很小的数组来表示．因而避免了以往算法需递归构造条件FP—tree来计算最大频繁项集的弊端,极大的降低了内存空间和时间开销,提高了挖掘效率。实验表明,与FP—Max算法相比。算法的效率提高了1倍以上。相似文献

13.

在单向FP-tree上挖掘频繁闭项集 总被引：1，自引：0，他引：1

下载免费PDF全文

王现君宋晶晶姜保庆《计算机工程与应用》2008,44(10):150-153

频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算频繁闭项集的弊端,极大地降低了内存空间和时间开销,提高了挖掘效率。相似文献

14.

An improved frequent pattern growth method for mining association rules

Ke-Chung Lin I-En Liao Zhi-Sheng Chen 《Expert systems with applications》2011,38(5):5154-5161

Many algorithms have been proposed to efficiently mine association rules. One of the most important approaches is FP-growth. Without candidate generation, FP-growth proposes an algorithm to compress information needed for mining frequent itemsets in FP-tree and recursively constructs FP-trees to find all frequent itemsets. Performance results have demonstrated that the FP-growth method performs extremely well. In this paper, we propose the IFP-growth (improved FP-growth) algorithm to improve the performance of FP-growth. There are three major features of IFP-growth. First, it employs an address-table structure to lower the complexity of forming the entire FP-tree. Second, it uses a new structure called FP-tree⁺ to reduce the need for building conditional FP-trees recursively. Third, by using address-table and FP-tree⁺ the proposed algorithm has less memory requirement and better performance in comparison with FP-tree based algorithms. The experimental results show that the IFP-growth requires relatively little memory space during the mining process. Even when the minimum support is low, the space needed by IFP-growth is about one half of that of FP-growth and about one fourth of that of nonordfp algorithm. As to the execution time, our method outperforms FP-growth by one to 300 times under different minimum supports. The proposed algorithm also outperforms nonordfp algorithm in most cases. As a result, IFP-growth is very suitable for high performance applications. 相似文献

15.

基于有限个条件FP_树中挖掘频繁模式

下载免费PDF全文

林丽冯少荣薛永生《计算机工程与应用》2007,43(5):175-177

在数据挖掘中发现关联规则是一个基本问题,而关联规则发现中最昂贵的步骤便是寻找频繁模式。FP_growth(frequent-patern growth)方法在产生长短频繁项集时不产生候选项集,从而大大提高了挖掘的效率,但是FP_growth在挖掘频繁模式时候产生大量的条件FP树从而占用大量空间,对FP_growth进行研究提出一种改进算法不仅利用FP_growth 算法所有优点,而且避免FP_growth的缺陷。主要通过建立有限棵条件FP树（数目为事务数据库的属性个数）来挖据长短频繁模式,大大节省FP_growth算法所需要空间,实验证明本文算法是有效的。相似文献

16.

基于改进的FP-tree的频繁模式挖掘算法

李也白唐辉张淳贺玉明《计算机应用》2011,31(1):101-103

FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上, 改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。相似文献