期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李也白唐辉张淳贺玉明《计算机应用》2011,31(1):101-103

FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上, 改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。相似文献

2.

一种基于FP-tree的最大频繁项目集挖掘算法

梅俊郑刚《现代计算机》2009,(9):33-36

提出一种基于FP—tree的最大频繁项目挖掘算法DMFIA—D,该算法运用双向搜索策略。根据FP—tree构造特征自顶向下选取最大频繁候选项集,自底向上对候选项集进行计数、剪枝最终确定最大频繁项目集。由于减少了最大频繁候选集,并对候选集进行有效剪枝,从而缩短算法的挖掘时间,提高挖掘效率。相似文献

3.

改进的基于FP-tree的频繁项集挖掘算法

下载免费PDF全文

郭伟叶德谦《计算机工程与应用》2007,43(19):174-176

对于频繁项集挖掘,采用一种FP-数组技术来减少FP-tree的遍历时间,减少数据集的扫描次数,在此基础上提出了一种基于FP-tree进行频繁项集挖掘的FP-growth+算法,提高了算法的效率。最后的实验证明了该算法的有效性。相似文献

4.

基于FP-tree的最大频繁模式挖掘算法 总被引：11，自引：0，他引：11

冯志新钟诚《计算机工程》2004,30(11):123-124

在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明．算法FP-Max在挖掘密集型数据集方面是高效的。相似文献

5.

一种基于FP-tree的最大频繁项目集挖掘算法 总被引：7，自引：0，他引：7

刘乃丽李玉忱马磊《计算机应用》2005,25(5):998-1000

挖掘关联规则是数据挖掘领域中的重要研究内容,其中挖掘最大频繁项目集是挖掘关联规则中的关键问题之一,以前的许多挖掘最大频繁项目集算法是先生成候选,再进行检验,然而候选项目集产生的代价是很高的,尤其是存在大量长模式的时候。文中改进了FP 树结构,提出了一种基于FP tree的快速挖掘最大频繁项目集的算法DMFIA 1,该算法不需要生成最大频繁候选项目集,比DMFIA算法挖掘最大频繁项目集的效率更高。改进的FP 树是单向的,每个结点只保留指向父结点的指针,这大约节省了三分之一的树空间。相似文献

6.

关联规则中改进FP-tree的最大频繁模式挖掘算法

钱雪忠惠亮《计算机工程与设计》2010,31(21)

关联规则挖掘是数据挖掘领域中重要的研究内容,最大频繁模式挖掘又是关联规则挖掘中的关键问题之一.针对已有的最大频繁模式挖掘算法存在的问题,通过对FP-Growth、FP-Max算法的分析,提出了基于改进FP-tree的最大频繁模式挖掘算法DFP-Max.该算法使用预测、剪枝的策略减少条件FP-tree个数,采用数字集匹配代替项集匹配的方式,减少超集检验的次数,并且避免了中间结果的组合连接,从而使算法达到较高的效率.实验结果表明,在支持度相对较小情况下,DFP-Max的效率是同类算法的2～5倍. 相似文献

7.

基于逆向FP-树的频繁模式挖掘算法 总被引：8，自引：0，他引：8

赵艳铎宋斌恒《计算机应用》2005,25(6):1385-1387

提出了一种称为逆向FP 合并的算法,该算法逆向构造FP 树并通过在其中寻找频繁扩展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP 增长算法,其中时间效率提高了2倍以上。此外,新算法还具有良好的伸缩性。相似文献

8.

在单向FP-tree上挖掘频繁闭项集 总被引：1，自引：0，他引：1

下载免费PDF全文

王现君宋晶晶姜保庆《计算机工程与应用》2008,44(10):150-153

频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算频繁闭项集的弊端,极大地降低了内存空间和时间开销,提高了挖掘效率。相似文献

9.

基于FS-tree的频繁模式挖掘算法

下载免费PDF全文

史旻昱马辉民唐述科《计算机工程与应用》2008,44(30):167-169

关联规则挖掘是数据挖掘中的一个重要研究方向,用于发现项集之间的关联性。FP-growth算法通过构造FP-tree产生频繁集,由于其不生成候选集从而大大降低了搜索开销,其缺点是占用大量的内存空间。基于FP-growth的算法思想,提出基于FS-tree（频繁1-项子树）的频繁模式挖掘算法,通过将FP-tree拆分为多棵FS-tree,使算法的空间复杂度明显减小。实验表明,该算法是有效的。相似文献

10.

用有序FP-tree挖掘最大频繁项集

于红王秀坤孟军《控制与决策》2007,22(5):520-524

提出了完全前缀路径和有序FP-tree的概念,给出根据数据项所在的层建立有序FP-tree的方法,利用有序FP-tree表示数据.提出用有序FP-tree中的完全前缀路径进行最大频繁项集挖掘的算法——MFIM算法,该算法利用有序FP-tree中的完全前缀路径对挖掘算法进行优化.实验结果表明,该算法对于浓密数据集中挖掘长模式具有较好的性能. 相似文献

11.

一种基于频繁模式树的最大频繁项目集挖掘算法

任永功张亮付玉《小型微型计算机系统》2010,31(2)

目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,这类算法会产生巨大的候选集并且重复扫描数据库.针对这一问题,给出一种基于频繁模式树的最大频繁项目集挖掘算法FP-MFIA,该算法利用频繁模式树对最大频繁项目集进行检索,通过位图建树的方法有效的减少了扫描数据库的次数,从而节省了CPU的执行时间.另外,此算法运用独特的最大频繁项目集判断策略,同时运用投影技术进行超集检测,提高了遍历的效率,实验结果表明该算法是快速有效的. 相似文献

12.

在FP-树中挖掘频繁模式而不生成条件FP-树 总被引：33，自引：1，他引：33

范明李川《计算机研究与发展》2003,40(8):1216-1222

FP-growth算法是目前已发表的最有效的频繁模式挖掘算法之一．然而，由于在挖掘频繁模式时需要递归地生成大量的条件FP-树，其时空效率仍然不够高．改进了FP-树结构，提出了一种基于被约束子树挖掘频繁项集的有效算法．改进的FP-树是单向的，每个结点只保留指向父结点的指针，这大约节省了三分之一的树空间．通过引入被约束子树(可以用3个很小的数组表示)，算法在挖掘频繁模式时不生成条件FP-树，从而大大提高了频繁模式挖掘的时空效率．实验表明，与FP-growth算法相比，算法的挖掘速度提高了1倍以上，而所需的存储空间减少了一半．此外，随着数据库规模的增大，算法具有很好的可伸缩性．对于稠密数据集，算法也具有良好的性能．相似文献

13.

基于改进FP-树的最大模式挖掘算法 总被引：2，自引：0，他引：2

孟祥萍王华金王贤勇任纪川鞠传香《计算机工程与应用》2005,41(14):179-181,228

频繁模式挖掘是数据挖掘领域中的一个非常重要的分支,但是由于其内在的计算复杂性,挖掘密集型数据的频繁模式完全集非常困难而且数量往往大得惊人,难以理解和应用。最大频繁模式(最大模式)压缩隐含了所有的频繁模式,存储所占用的空间远远小于完全集,因而最大模式挖掘具有十分重要的意义。该文改进了传统的FP-树结构并提出了一种有效的基于改进FP-树的最大模式挖掘算法IFP-M ax;通过引入后缀子树的概念,算法在挖掘过程中不用生成最大频繁模式候选集,从而大大提高了算法的时间效率和空间可伸缩性。实验表明,IFP-M ax的挖掘速度比M AFIA和GenM ax大约快一个数量级。相似文献

14.

基于FP—tree的最大频繁项集挖掘新算法

彭慧伶舒云星武新《计算技术与自动化》2009,28(2):62-65

研究挖掘关联规则的一个重要工作就是找出所有的频繁项集。基于FP—tree的最大频繁项集挖掘算法要多次生成大量的FP—tree,并且需要对其多次遍历,消耗了大量的时间。针对以上缺点,提出一种基于FP—tree并利用数组和矩阵技术进行优化的最大频繁项集挖掘算法（Mining Maximal Frequent Itemset。简称MMFI）,它既减少创建FP—tree的数量,又节省遍历FP—tree的时间,实验证明本算法是有效的。相似文献

15.

基于FP-Tree的共享前缀频繁项集挖掘算法

下载免费PDF全文

胡中栋罗会兰曾珽《计算机工程与应用》2009,45(27):137-139

在数据挖掘中发现关联规则是一个基本问题,而发现频繁项集是关联规则挖掘中最基本、最重要的问题。提出了基于FP-Tree的共享前缀频繁项集挖掘算法－FP-SPMA算法。构造FP-Tree来压缩事务数据库,通过共享前缀和前瞻剪枝快速减小候选项集,无需递归构造条件模式树,算法性能有明显的提高。相似文献

16.

基于FP-树挖掘大数据库的方法及算法PCM 总被引：1，自引：0，他引：1

郑泉王建东《计算机工程与应用》2004,40(7):182-184,197

该文提出了一种用FP-树挖掘大数据库的新方法及其算法PCM。在该方法中,首先把大数据库划分成子数据库的集合,然后在每个子数据库上构造FP-树并挖掘它,如果子数据库的FP-树不能放进内存,则该方法可递归地用于该子数据库。相似文献

17.

一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法 总被引：7，自引：2，他引：7

宋余庆朱玉全孙志挥杨鹤标《计算机研究与发展》2005,42(5):777-783

目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时 ,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些项目的布尔表达式约束条件,提出了一种快速的基于FP-tree的约束最大频繁项目集挖掘算法CMFIMA,并对其更新问题进行了研究,提出了一种增量式更新约束最大频繁项目集挖掘算法CMFIUA. 相似文献

18.

基于频繁模式树的约束最大频繁项集挖掘算法 总被引：1，自引：0，他引：1

下载免费PDF全文

花红娟张健陈少华《计算机工程》2011,37(9):78-80

多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖掘效率。实验结果证明,该算法的效率优于同类算法。相似文献