首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
Apriori算法是经典的频繁项目集生成算法,在数据挖掘界起着里程碑的作用。但是该算法要求多次扫描可能非常大的交易数据库。文章在Apriori算法的基础上,提出了一种改进的关联规则挖掘算法-GBARM。该算法能够使得每次扫描的事务数大大减少,并且能够逐步减小候选k-项集的规模,从而改善算法的性能。  相似文献   

2.
基于Apriori 分类事务库关联规则算法   总被引:3,自引:1,他引:2       下载免费PDF全文
Apriori 算法是通过定义的事务库来生成频繁项集,确定各数据之间的关联规则。在实际应用中生成事务库时常常会出现同一项目中重复类型的事务库,而同一项目的事务之间的支持度为零。因此,事务库的定义方法是直接影响生成关联规则的生成速度与效率,针对这一问题,本文提出并实现了一种基于Apriori 分类事务库的关联规则算法。该方法改变了传统Apriori 算法中所有事务统一定义的方法,对不同项目的事务进行分类定义,通过这种的实现,不但减少了计算机的大量运算,而且提高了关联规则的生成速度。  相似文献   

3.
关联规则挖掘搜索给定数据集中反复出现的数据模式,找到它们之间的相关性。分析了经典Apriori算法存在的时空效率低的缺点和数据形式对算法效率的影响。提出一种基于动态散列和事务压缩技术的改进,动态应用散列技术减小候选频繁项集的规模和数据库扫描次数,应用事务压缩技术缩小数据库中事务量的长度和总数,从而提高了算法的时间空间效率。与Apriori算法进行的比较验证了新算法的正确性与效率。  相似文献   

4.
基于数组的关联规则挖掘算法   总被引:12,自引:0,他引:12  
孟祥萍  钱进  刘大有 《计算机工程》2003,29(15):98-99,109
提高频繁项集挖掘算法的效率是关联规则挖掘研究的一个重点领域。文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,通过不断减少数据库中的事务个数,并且利用一维数组对候选2-项集进行计数来提高挖掘效率。实验表明,该文所提出的算法效率比经典Apriori算法快2~3倍。  相似文献   

5.
基于数组的关联规则挖掘算法   总被引:4,自引:1,他引:3  
文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,利用数组的结构特性来提高挖掘效率。  相似文献   

6.
基于关联规则挖掘中的Apriori算法,在一定条件下,进行局部改进来提高挖掘的时间效率。这种改进本身并不会需要多大的系统开销,但是可以使算法在某些情况下运行得更快些。  相似文献   

7.
一种有效的基于图的关联规则挖掘算法   总被引:2,自引:0,他引:2  
陈明  史忠植  王文杰 《计算机应用》2006,26(11):2654-2656
基于图的关联规则挖掘算法是一种通过构建关联图并直接生成候选频繁项集,进而验证得到所有频繁项集的算法。在该算法中,对候选项集的验证操作占用了大量的时间,为此提出了改进算法。改进主要体现在两个方面:按支持度降序对频繁1项重新编号再构建关联图;利用Apriori性质删减用来生成候选项集的冗余扩展项节点。实验结果表明,在最小支持度阈值较小时,改进算法有效减少了冗余的候选频繁项集,提高了算法的性能。  相似文献   

8.
对挖掘关联规则中的Apriori算法的一种改进   总被引:1,自引:1,他引:0  
对挖掘关联规则的Apriori算法关键思想以及性能进行了研究,给出该算法的一个改进算法,该改进算法提高了原算法的性能,并从实验中得出相关结果.  相似文献   

9.
关联规则挖掘是数据挖掘中的一个重要研究内容.为了高效、快速地从事务数据库中挖掘出频繁项集,针对数据挖掘的经典关联规则Apriori算法的瓶颈问题提出了改进的方法.算法将事物数据库映射到布尔型数组中,然后所有的操作都针对数组元素值展开.这样大大减少了数据库的扫描次数.算法利用数组的随机访问特性及布尔型数据的简单"与"操作,直接产生频繁项集,而不产生大量的候选项集.经理论分析和实验结果显示该算法在效率上明显优于Apriori 算法.  相似文献   

10.
关联规则挖掘则是数据挖掘中最重要的分支之一。它着重研究大量数据中项集之间有趣的关联或相关关系,一个典型的例子就是购物篮分析。该过程可以分析出哪些商品顾客倾向于在一起购买,从而可以为商店经理提供比较好的商店布局方式。例如,通过分析,我们发现,顾客在购买了一台计算机以后,一般都会去购买财务管理软件,那么我们就可以把计算机和财务管理软件放在比较近的位置,以增加销售量。这里主要介绍了关联规则挖掘的经典算法,Apriori算法,同时给出了关联规则中的基本概念,然后分析了算法的运行效率。提出了改进的方法。  相似文献   

11.
基于位串数组的关联规则挖掘算法   总被引:4,自引:0,他引:4  
挖掘关联规则是数据挖掘研究的一个重要方面。然而,目前提出的算法仍存在一些问题,如复杂的数据结构、候选项集生成等等。该文使用更简单的数据结构———位串数组,并提出了一种新的挖掘算法。该方法能通过并行投影和压缩技术扩展到大数据库中进行挖掘规则。  相似文献   

12.
关联规则挖掘算法更新与拓展   总被引:3,自引:1,他引:3  
皋军  王建东 《计算机工程与应用》2003,39(35):178-179,202
该文通过对已有的关联规则的增量式IUA算法进行分析和修改,提出了My_IUA算法,并将此算法新的应用领域加以拓展。  相似文献   

13.
郑涛  张伟 《计算机工程》2003,29(13):103-104,111
数据挖掘的一个重要方面是挖掘关联规则,目前已提出了包括经典算法Apriori在内的许多算法,而在实际关联规则的挖掘过程中,用户将需要不断调整用于描述用户兴趣程度的阈值:最小支持度和最小置信度。如何维护已发现的关联规则变得至关重要。该文提出的GIUA算法解决了在数据库D不变的情况下,最小支持度和最小置信度发生变化时关联规则的维护问题,最大效率地利用原有结果,通过动态分组将连接步和修剪步的循环减到最少,并尽可能地将挖掘过程并行化。  相似文献   

14.
基于最大模式的关联规则挖掘算法研究   总被引:6,自引:7,他引:6  
提出了一种基于最大模式的关联规则挖掘算法,探讨了它的实现步骤,最后通过实例说明它是数据挖掘中一种有效的关联规则挖掘算法。  相似文献   

15.
针对关联规则挖掘经典的Apriori算法多次扫描数据库,侯选项集数目多而引起的效率低下问题,本文提出了将Apriori算法与散列技术和自适应步长相结合的改进算法,算法压缩了侯选项集的数目以及减少了扫描数据库的次数.通过理论分析与实验结果表明,该算法与经典的Apriori算法相比较,效率上有明显的提高,特别是对大事务集,长事务集数据挖掘效果更为明显.  相似文献   

16.
一种无冗余的快速关联规则发现算法   总被引:4,自引:0,他引:4  
吴伟平  林馥  贺贵明 《计算机工程》2003,29(8):90-91,108
关联规则的发现是数据挖掘的一个重要方面。传统算法不但涉及大量的数据库操作,而且生成的关联规则之间存在着大量的冗余规则。文章给出了一种无冗余的快速关联规则算法,能大量减少所需的I/O的次数,内存开销适中,并且利用规则之间的冗系关系消除了规则之间的冗余性。  相似文献   

17.
基于Hash表的关联规则挖掘算法的改进   总被引:1,自引:0,他引:1  
经典的Apriori算法在大项目集的挖掘过程中因为重复搜索导致效率低下。提出一种改进的Hash表结构应用于DHP算法中的项目集存放,定义新的Hash函数确定项目集的存放地址,并基于新的Hash表结构,以并行挖掘的方式优化关联规则算法的剪枝过程。实验结果表明,与Apriori算法相比,文中的方法可以更好地节省存储空间,提高挖掘效率。  相似文献   

18.
经典的Apriori算法在大项目集的挖掘过程中因为重复搜索导致效率低下。提出一种改进的Hash表结构应用于DHP算法中的项目集存放,定义新的Hash函数确定项目集的存放地址,并基于新的Hash表结构,以并行挖掘的方式优化关联规则算法的剪枝过程。实验结果表明,与Apriori算法相比,文中的方法可以更好地节省存储空间,提高挖掘效率。  相似文献   

19.
一种改进的关联规则挖掘算法   总被引:9,自引:0,他引:9  
庄晓毅  张忠能 《计算机工程》2004,30(14):128-129,135
目前,已经提出了许多挖掘关联规则的算法,其中最著名的是Apriori算法及其变型。这些传统的算法大多存在项集生成瓶颈和难以确定合适的支持度阈值的问题,并且没有考虑数据库的被分析项的各自不同的重要性。为了解决这些问题,该文提出了一种新的关联挖掘算法。  相似文献   

20.
卢炎生  王莉  赵栋 《计算机工程》2005,31(5):99-101
提出了一个基于无或言规则集的改进的关联规则算法——IHPD,无或言规则集(disjunction-frce sets)是一种精简集表示。这一算法总结了HLinEx,IHP和DHP算法的优点,极大地改善了算法性能,并且使算法的使用不仅仅局限于长类型的频繁项目集挖掘,实验结果表明IHPD算法在性能上比HLinEx更高效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号