首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
随着科学技术的发展,人们可以更快、更方便地获取数据、保存数据,数据的量和复杂程度都是前所未见。该文对数据挖掘技术中的关联规则挖掘进行了系统的分析和研究,并在经典的Apriori算法的基础上改进了一个算法。该算法是一种基于矩阵的关联规则挖掘算法,通过扫描将数据库映射为0-1矩阵,直接在矩阵上进行运算,避免了反复扫描的过程,还对Apriori性质进行了引申和利用,对矩阵进行彻底的压缩。理论分析和实验证明了改进算法在效率上的提高。  相似文献   

2.
深入研究关联规则算法, 针对Apriori算法瓶颈问题提出了一种改进算法, 该算法在构建向量矩阵的基础上, 只需要扫描一次事务数据库, 通过优化连接和剪枝, 提高了算法的运行效率. 研究和实验表明, 改进后的算法在大规模的事务数据库中, 较Apriori算法有明显的优势.  相似文献   

3.
关联规则反映了大量数据中项集间的相互依存性和关联性。Apriori算法是关联规则挖掘中的经典算法,目前已有很多的改进版本,但大多存在多次扫描数据库,项集生成瓶颈和模式匹配频繁的问题,算法效率比较低。本文深入的分析研究关联规则Apriori算法,改进候选频繁项目集的连接和剪枝策略,改进对事务的处理方式,减少模式匹配所需的时间开销,并给出了改进算法。  相似文献   

4.
一种基于关联规则Apriori算法的改进研究   总被引:1,自引:0,他引:1  
介绍Apriori算法的原理和基础,并对制约Apriori算法效率的瓶颈问题提出一种改进策略,针对该算法的两个缺陷,多次扫描事务数据库并产生大量的候选集,提出一种0-1矩阵的改进算法改变由低维频繁项目集到高维频繁项目集的多次连接运算。此改进算法大大减少了访问数据库的次数,提高系统的运行效率,同时还减少大量的候选集的产生,节约存储空间。  相似文献   

5.
挖掘关联规则中Apriori算法的研究与改进   总被引:10,自引:5,他引:10  
关联规则是数据挖掘中重要的研究课题。对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,指出该算法的某些不足,并且提出了一种产生候选项集的新算法。该算法提高了原算法的效率。  相似文献   

6.
挖掘关联规则中Apriori算法的改进   总被引:24,自引:0,他引:24  
本文基于对挖掘关联规则中Apriori算法的研究,给出两种改进的算法。  相似文献   

7.
挖掘关联规则中Apriori算法的研究与改进   总被引:17,自引:0,他引:17  
胡吉明  鲜学丰 《微机发展》2006,16(4):99-101
关联规则是数据挖掘中重要的研究课题。对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,指出该算法的某些不足,并且提出了一种产生候选项集的新算法。该算法提高了原算法的效率。  相似文献   

8.
关联规则Apriori算法   总被引:1,自引:0,他引:1  
阐述了关联规则的基本概念、Apriori算法及其实验结果分析,并描述了Apriori算法的性能瓶颈与改进策略。  相似文献   

9.
陈晓春 《福建电脑》2012,28(4):92-93
对关联规则经典算法中的Apriori算法进行了深入研究与分析,针对其需要反复扫描事务数据库,造成大量I/O开销,影响关联规则挖掘效率这一不足之处,提出了改进,并通过测试程序验证了算法改进的可行性。  相似文献   

10.
该文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,并对其进行以下三方面改进:改善候选项集支持度的计算方法;缩小候选项集的生成规模;减少对数据库的扫描次数。实验结果表明,改进算法性能得到了明显提高。  相似文献   

11.
关联规则之Apriori算法的改进   总被引:3,自引:0,他引:3  
钱冬云 《福建电脑》2006,(3):99-100
关联规则是数据挖掘的重要研究内容。Apriori算法是关联规则之经典算法。本文在分析经典Apriori算法的基础上.提出了改进型的Apriori算法。新算法采用事务压缩技术,提高了数据挖掘的效率,具有一定的实用性。  相似文献   

12.
随着大数据时代的到来,数据挖掘技术成为了信息界的主要关注方向,但从大量数据中提取有价值的内容成为了难题。随着数据量的逐渐增加,以往的数据挖掘方法已不再适应当前大数据环境下的大数据挖掘。基于此,不断研究和改进Apriori算法的主要目的是使其能适应当前环境下的数据挖掘、存储和计算,使繁琐的数据挖掘过程变得简单明了,提高挖掘效率。  相似文献   

13.
该文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,并对其进行以下三方面改进:改善候选项集支持度的计算方法;缩小候选项集的生成规模;减少对数据库的扫描次数。实验结果表明.改进算法性能得到了明显提高。  相似文献   

14.
本文采用一种基于布尔矩阵的频繁集挖掘算法。该算法直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法的连接和剪枝,通过不断压缩支持矩阵,不仅节约了存储空间,还提高了算法的效率。  相似文献   

15.
关联规则挖掘Apriori算法的研究与改进   总被引:7,自引:1,他引:6  
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联.Apriori算法是关联规则挖掘中的经典算法.然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点.对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法.该算法基于新的数据结构,改进了产生候选项集的连接方法.在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著.  相似文献   

16.
在所有的关联规则的挖掘算法中Apriori算法是最为经典的一个,但Apriofi算法有两个缺陷,即要扫描多次数据库以及生成大量的候选集。本文提出一种利用对项进行编码的方法对该算法进行改进,通过对项编码来减少扫描数据库次数并通过删除项来减少生成候选集的数量,从而提高算法的效率。相同条件下的实验结果表明,该优化后的算法能有效地提高关联规则挖掘的效率。  相似文献   

17.
挖掘关联规则中Apriori算法的研究   总被引:55,自引:0,他引:55  
文章是基于大型销售数据库研究了关联规则挖掘问题 .分析和探讨了 Apriori算法 ,并给出了该算法的实现思想 ,同时通过例子说明算法的执行过程  相似文献   

18.
关联规则挖掘中对Apriori算法的研究   总被引:3,自引:1,他引:3       下载免费PDF全文
针对Apriori寻找频繁项集问题,提出了基于垂直事务列表的树形结构的挖掘算法。该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。  相似文献   

19.
基于改进Apriori算法的关联规则挖掘研究   总被引:2,自引:2,他引:2  
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法——Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。  相似文献   

20.
关联规则挖掘中Apriori算法的研究与改进   总被引:5,自引:0,他引:5  
崔贯勋  李梁  王柯柯  苟光磊  邹航 《计算机应用》2010,30(11):2952-2955
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号