首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
Apriori算法是经典的频繁项目集生成算法,在数据挖掘界起着里程碑的作用。但是该算法要求多次扫描可能非常大的交易数据库。文章在Apriori算法的基础上,提出了一种改进的关联规则挖掘算法-GBARM。该算法能够使得每次扫描的事务数大大减少,并且能够逐步减小候选k-项集的规模,从而改善算法的性能。  相似文献   

2.
基于数组的关联规则挖掘算法   总被引:12,自引:0,他引:12  
孟祥萍  钱进  刘大有 《计算机工程》2003,29(15):98-99,109
提高频繁项集挖掘算法的效率是关联规则挖掘研究的一个重点领域。文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,通过不断减少数据库中的事务个数,并且利用一维数组对候选2-项集进行计数来提高挖掘效率。实验表明,该文所提出的算法效率比经典Apriori算法快2~3倍。  相似文献   

3.
基于Apriori 分类事务库关联规则算法   总被引:2,自引:1,他引:2  
Apriori 算法是通过定义的事务库来生成频繁项集,确定各数据之间的关联规则。在实际应用中生成事务库时常常会出现同一项目中重复类型的事务库,而同一项目的事务之间的支持度为零。因此,事务库的定义方法是直接影响生成关联规则的生成速度与效率,针对这一问题,本文提出并实现了一种基于Apriori 分类事务库的关联规则算法。该方法改变了传统Apriori 算法中所有事务统一定义的方法,对不同项目的事务进行分类定义,通过这种的实现,不但减少了计算机的大量运算,而且提高了关联规则的生成速度。  相似文献   

4.
关联规则挖掘搜索给定数据集中反复出现的数据模式,找到它们之间的相关性。分析了经典Apriori算法存在的时空效率低的缺点和数据形式对算法效率的影响。提出一种基于动态散列和事务压缩技术的改进,动态应用散列技术减小候选频繁项集的规模和数据库扫描次数,应用事务压缩技术缩小数据库中事务量的长度和总数,从而提高了算法的时间空间效率。与Apriori算法进行的比较验证了新算法的正确性与效率。  相似文献   

5.
基于数组的关联规则挖掘算法   总被引:4,自引:1,他引:3  
文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,利用数组的结构特性来提高挖掘效率。  相似文献   

6.
基于关联规则挖掘中的Apriori算法,在一定条件下,进行局部改进来提高挖掘的时间效率。这种改进本身并不会需要多大的系统开销,但是可以使算法在某些情况下运行得更快些。  相似文献   

7.
一种有效的基于图的关联规则挖掘算法   总被引:2,自引:0,他引:2  
陈明  史忠植  王文杰 《计算机应用》2006,26(11):2654-2656
基于图的关联规则挖掘算法是一种通过构建关联图并直接生成候选频繁项集,进而验证得到所有频繁项集的算法。在该算法中,对候选项集的验证操作占用了大量的时间,为此提出了改进算法。改进主要体现在两个方面:按支持度降序对频繁1项重新编号再构建关联图;利用Apriori性质删减用来生成候选项集的冗余扩展项节点。实验结果表明,在最小支持度阈值较小时,改进算法有效减少了冗余的候选频繁项集,提高了算法的性能。  相似文献   

8.
对挖掘关联规则中的Apriori算法的一种改进   总被引:1,自引:1,他引:0  
对挖掘关联规则的Apriori算法关键思想以及性能进行了研究,给出该算法的一个改进算法,该改进算法提高了原算法的性能,并从实验中得出相关结果.  相似文献   

9.
关联规则挖掘则是数据挖掘中最重要的分支之一。它着重研究大量数据中项集之间有趣的关联或相关关系,一个典型的例子就是购物篮分析。该过程可以分析出哪些商品顾客倾向于在一起购买,从而可以为商店经理提供比较好的商店布局方式。例如,通过分析,我们发现,顾客在购买了一台计算机以后,一般都会去购买财务管理软件,那么我们就可以把计算机和财务管理软件放在比较近的位置,以增加销售量。这里主要介绍了关联规则挖掘的经典算法,Apriori算法,同时给出了关联规则中的基本概念,然后分析了算法的运行效率。提出了改进的方法。  相似文献   

10.
探讨了Apriori算法的改进问题,提出了一种适用于中小数据集的关联规则挖掘算法。该算法主要特点是简单、清晰、高效。一方面充分使用了内存的高效存贮,另一方面使用了位运算快速进行计数,同时简化了Apriori算法中频繁项集的计算,大大的减少了中间变量及其存贮的时间和空间,提高了关联规则挖掘的速度和效率。  相似文献   

11.
基于位串数组的关联规则挖掘算法   总被引:4,自引:0,他引:4  
挖掘关联规则是数据挖掘研究的一个重要方面。然而,目前提出的算法仍存在一些问题,如复杂的数据结构、候选项集生成等等。该文使用更简单的数据结构———位串数组,并提出了一种新的挖掘算法。该方法能通过并行投影和压缩技术扩展到大数据库中进行挖掘规则。  相似文献   

12.
正负关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
本文提出了一种快速有效的正、负关联规则挖掘算法 MPNAR。另外,针对关联规則挖掘算法中支持数计算的复杂性,提出了一种基于二进制形式的支持数计算方法。实验结果表明算法 MPNAR 是有效和可行的。  相似文献   

13.
关联规则挖掘综述*   总被引:1,自引:0,他引:1  
为深入理解关联规则挖掘技术,掌握其研究现状与发展趋势。首先介绍了关联规则相关定义与分类方法;其次从串行和并行两个角度总结了关联规则挖掘的一般方法,概述并分析了一些典型的关联规则挖掘模式;最后讨论了关联规则挖掘质量改善问题及领域应用。  相似文献   

14.
关联规则挖掘算法更新与拓展   总被引:3,自引:1,他引:3  
皋军  王建东 《计算机工程与应用》2003,39(35):178-179,202
该文通过对已有的关联规则的增量式IUA算法进行分析和修改,提出了My_IUA算法,并将此算法新的应用领域加以拓展。  相似文献   

15.
郑涛  张伟 《计算机工程》2003,29(13):103-104,111
数据挖掘的一个重要方面是挖掘关联规则,目前已提出了包括经典算法Apriori在内的许多算法,而在实际关联规则的挖掘过程中,用户将需要不断调整用于描述用户兴趣程度的阈值:最小支持度和最小置信度。如何维护已发现的关联规则变得至关重要。该文提出的GIUA算法解决了在数据库D不变的情况下,最小支持度和最小置信度发生变化时关联规则的维护问题,最大效率地利用原有结果,通过动态分组将连接步和修剪步的循环减到最少,并尽可能地将挖掘过程并行化。  相似文献   

16.
一个改进的关联规则的频繁项目集数据挖掘算法   总被引:1,自引:0,他引:1  
吴振光 《计算机科学》2007,34(9):145-147
在关联规则中的Apriori算法,具有天生的缺陷,运行效果很不理想。为了克服Apriori算法的缺点,本文提出了一个改进的算法:在产生频繁项目集组合时,只需扫描数据库一次,这样就可以有效率地降低I/O的存取时间,更快速地找出符合使用者需求的关联规则。仿真实验表明,该算法是有效的。  相似文献   

17.
一种关联规则的增量式更新算法   总被引:10,自引:0,他引:10  
石冰  郑燕峰 《计算机工程》2000,26(8):101-103
对在事务数据库不变的情况下,如何进行关联规则的维护问题进行了探讨,提出了一种高效的增量式更新算法。  相似文献   

18.
基于最大模式的关联规则挖掘算法研究   总被引:6,自引:7,他引:6  
提出了一种基于最大模式的关联规则挖掘算法,探讨了它的实现步骤,最后通过实例说明它是数据挖掘中一种有效的关联规则挖掘算法。  相似文献   

19.
一种动态的频繁项集挖掘算法   总被引:2,自引:0,他引:2       下载免费PDF全文
提出了一种基于无向项集图的动态频繁项集挖掘算法。当事务数据库和最小支持度发生变化时,该算法只需重新遍历一次无向项集图,即可得到新的频繁项集。与传统的频繁项集挖掘算法相比,在执行效率上有显著提高。  相似文献   

20.
在约束关联规则挖掘过程中,影响交互的制约因素是挖掘算法的执行时间。为了提高挖掘过程的交互性,文章提出一种基于两阶段的约束关联规则挖掘算法。算法利用已挖掘的关联规则,实现约束关联规则的挖掘过程。在算法实现的过程中对关联规则集存储结构进行了优化,并扩展了类SQL查询语句。实验结果表明,由于在约束条件挖掘的过程中不需要再对数据库进行挖掘处理,节省了大量的用户时间,因此算法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号