期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

SFP-Max——基于排序FP-树的最大频繁模式挖掘算法 总被引：12，自引：1，他引：11

秦亮曦史忠植《计算机研究与发展》2005,42(2):217-223

FP-growth算法是目前较高效的频繁模式挖掘算法之一,但将它用于最大频繁模式挖掘时却不能获得较高的效率.深入分析了造成低效的原因,提出了利用排序FP-树挖掘最大频繁模式的算法SFP-Max. 算法的主要思想如下：①基于排序FP-树;②利用最大频繁模式的性质,减小产生的候选最大模式的规模;③设置中间结果集,缩小检验的范围,从而减少检验候选最大模式的时间.实验表明,SFP-Max是一个高效的最大频繁模式的挖掘算法,对于测试的数据集,SFP-Max的性能多数情况下都优于MAFIA算法. 相似文献

2.

基于改进FP-树的最大项目集挖掘算法* 总被引：1，自引：0，他引：1

谢志强朱孟杰杨静《计算机应用研究》2009,26(2):502-505

挖掘最大频繁项目集是多种数据挖掘应用中的关键问题。FP-growth算法是目前最有效的频繁模式挖掘算法之一,其在挖掘最大项目集时要递归生成大量的条件FP-树,存在时空效率不高的问题。于是结合改进的FP-树,提出了一种快速挖掘最大项目集的算法。该算法利用改进的FP-树是单向的且每个节点只保留指向父节点的指针,可以节约大量的存储空间;同时引入项目序列集和它的基本操作,使挖掘最大频繁项目集时不生成含大量候选项目的集合或条件FP-树,可以快速地挖掘出所有的最大频繁项目集。实例分析证明所提出的算法是可行的。相似文献

3.

基于压缩FP-树和数组技术的频繁模式挖掘算法 总被引：2，自引：0，他引：2

秦亮曦苏永秀刘永彬梁碧珍《计算机研究与发展》2008,45(Z1):244-249

FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine. 一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法. 相似文献

4.

一种改进的基于FP-树的最大目标频繁项集挖掘算法 总被引：1，自引：0，他引：1

下载免费PDF全文

梁碧珍陆月然秦亮曦《计算机工程与科学》2007,29(10):70-72

目前,基于FP-树的最大频繁项集挖掘算法存在的一个问题是FP-树的规模过大,遍历树需耗费大量的运行时间,并且挖掘出来的很多频繁项集是用户不感兴趣的,过多的无用频繁模式影响了挖掘的效率。本文提出一种排序紧缩非冗余的STFP-树,以及基于STFP-树的最大目标频繁项集挖掘算法STFP-MAX。该算法在满足用户需求的基础上有效地缩小了FP--树的规模,又加快了搜索的速度,从而提高了挖掘的效率。相似文献

5.

在FP-树中挖掘频繁模式而不生成条件FP-树 总被引：33，自引：1，他引：33

范明李川《计算机研究与发展》2003,40(8):1216-1222

FP-growth算法是目前已发表的最有效的频繁模式挖掘算法之一．然而，由于在挖掘频繁模式时需要递归地生成大量的条件FP-树，其时空效率仍然不够高．改进了FP-树结构，提出了一种基于被约束子树挖掘频繁项集的有效算法．改进的FP-树是单向的，每个结点只保留指向父结点的指针，这大约节省了三分之一的树空间．通过引入被约束子树(可以用3个很小的数组表示)，算法在挖掘频繁模式时不生成条件FP-树，从而大大提高了频繁模式挖掘的时空效率．实验表明，与FP-growth算法相比，算法的挖掘速度提高了1倍以上，而所需的存储空间减少了一半．此外，随着数据库规模的增大，算法具有很好的可伸缩性．对于稠密数据集，算法也具有良好的性能．相似文献

6.

基于逆向FP-树的频繁模式挖掘算法 总被引：8，自引：0，他引：8

赵艳铎宋斌恒《计算机应用》2005,25(6):1385-1387

提出了一种称为逆向FP 合并的算法,该算法逆向构造FP 树并通过在其中寻找频繁扩展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP 增长算法,其中时间效率提高了2倍以上。此外,新算法还具有良好的伸缩性。相似文献

7.

基于改进的FP-树和数组技术的频繁模式挖掘算法

孟志忠《电脑开发与应用》2012,25(9):43-45,51

FP-growth算法是目前较高效的频繁模式挖掘算法之一,该算法不产生候选项集,但递归构造“条件FP-Tree”的CPU 开销和存储很大.为此提出了一种频繁模式挖掘算法IFPmine.首先,为了节省内存空间,采用了约束子树的挖掘方法;其次,采用了数组技术来减少树的遍历时间,从而提高算法的效率.实验结果表明,IFP算法是一种较有效的频繁模式挖掘算法,其挖掘效率优于STFP-树算法和FP-树算法,而需要的内存却少于STFP-树和FP-树算法. 相似文献

8.

基于排序FP-树的频繁模式高效挖掘算法 总被引：11，自引：0，他引：11

秦亮曦李谦史忠植《计算机科学》2005,32(4):31-33

FP-growth算法是目前较高效的频繁模式挖掘算法之一。在FP-growth算法中,FP-树及条件FP-树的构造和遍历占了算法绝大部分的时间,如果能减少这方面的时间,则有望进一步改善算法的效率。本文给出了一个频繁模式挖掘算法SFP-growth。算法通过将FP-树有序化及采用高效排序算法等措施来提高FP-树构造的效率,从而使算法达到较高的效率。实验结果表明,SFP-growth是一个高效的频繁模式挖掘算法,其性能优于Apriori、Eclat和FP-growtn算法。相似文献

9.

基于FP-tree的最大频繁模式挖掘算法 总被引：11，自引：0，他引：11

冯志新钟诚《计算机工程》2004,30(11):123-124

在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明．算法FP-Max在挖掘密集型数据集方面是高效的。相似文献

10.

基于FP树的全局最大频繁项集挖掘算法 总被引：12，自引：1，他引：12

王黎明赵辉《计算机研究与发展》2007,44(3):445-451

挖掘最大频繁项集是多种数据挖掘应用了更新最大频繁候选项集集合,需要反复地扫描整个数据库,而且大部分算法是单机算法,全局最大频繁项集挖掘算法并不多见.为此提出MGMF算法,该算法利用FP-树结构,类似FP-树挖掘方法,一遍就可以挖掘出所有的最大频繁项集,并且超集检测非常简单、快捷.另外MGMF算法采用了分布式PDDM算法播报消息的思想,具有很好的拓展性和并行性.实验证明MGMF算法是有效可行的. 相似文献

11.

基于FP—tree的最大频繁项集挖掘新算法

彭慧伶舒云星武新《计算技术与自动化》2009,28(2):62-65

研究挖掘关联规则的一个重要工作就是找出所有的频繁项集。基于FP—tree的最大频繁项集挖掘算法要多次生成大量的FP—tree,并且需要对其多次遍历,消耗了大量的时间。针对以上缺点,提出一种基于FP—tree并利用数组和矩阵技术进行优化的最大频繁项集挖掘算法（Mining Maximal Frequent Itemset。简称MMFI）,它既减少创建FP—tree的数量,又节省遍历FP—tree的时间,实验证明本算法是有效的。相似文献

12.

快速统一挖掘超团模式和极大超团模式

肖波张亮徐前方蔺志青郭军《软件学报》2010,21(4):659-671

超团模式是一种新型的关联模式,这种模式所包含的项目相互间具有很高的亲密度.超团模式中某个项目在事务中的出现很强地暗示了模式中其他项目也会相应地出现.极大超团模式是一组超团模式更加紧凑的表示,可被用于多种应用.挖掘这两种模式的标准算法是完全不同的.提出一种基于FP-tree(frequent pattern tree)的快速挖掘算法——混合超团模式增长(hybrid hyperclique pattern growth,简称HHCP-growth),统一了两种模式的挖掘.算法采用递归挖掘方法,并应用多种有效的剪枝策略.提出并证明几个相关命题来说明剪枝策略的有效性和算法的正确性.实验结果表明,HHCP-growth算法相对于标准的超团模式挖掘算法和极大超团模式挖掘算法都具有更高的效率,尤其对于大数据集或在低支持度条件下更为显著. 相似文献

13.

特定数据最大频繁集挖掘算法 总被引：2，自引：0，他引：2

下载免费PDF全文

王华胡学钢田卫东《计算机工程》2008,34(14):63-65

针对在某些限定项目数与交易长度数据的关联规则挖掘中FP-growth算法执行效率很低的问题,提出一种最大频繁模式挖掘算法,该算法引入与FP-tree结构类似的All-subset tree存储所有的最大频繁项目集,无需在扫描数据库前指定最小支持度,可以动态给定最小支持度而不用重新扫描数据库。实验结果表明,该算法在这些特定数据的挖掘中,与FP-growth相比明显提高了挖掘效率。相似文献

14.

基于改进的FP-tree的频繁模式挖掘算法

李也白唐辉张淳贺玉明《计算机应用》2011,31(1):101-103

FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上, 改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。相似文献

15.

改进的基于FP-tree的频繁项集挖掘算法

下载免费PDF全文

郭伟叶德谦《计算机工程与应用》2007,43(19):174-176

对于频繁项集挖掘,采用一种FP-数组技术来减少FP-tree的遍历时间,减少数据集的扫描次数,在此基础上提出了一种基于FP-tree进行频繁项集挖掘的FP-growth+算法,提高了算法的效率。最后的实验证明了该算法的有效性。相似文献

16.

一种基于频繁模式树的最大频繁项目集挖掘算法

任永功张亮付玉《小型微型计算机系统》2010,31(2)

目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位图建树的方法有效的减少了扫描数据库的次数,从而节省了CPU的执行时间.另外,此算法运用独特的最大频繁项目集判断策略,同时运用投影技术进行超集检测,提高了遍历的效率,实验结果表明该算法是快速有效的. 相似文献