首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

2.
Apriori算法的一种优化方法   总被引:8,自引:3,他引:5       下载免费PDF全文
介绍关联规则挖掘中的经典算法――Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出一种改进的Apriori算法――En-Apriori算法。该算法采用矩阵的方法,只须扫描一遍数据库,同时优化了连接操作,较好地提高了算法的效率。实验结果表明,En-Apriori算法优于Apriori算法,具有较好的实用性。  相似文献   

3.
吴文妹  陈国龙 《福建电脑》2005,(4):17-17,14
本文利用频繁项集的一个性质,对Apriori算法中的生成候选项集这一步进行改进,大大减少不必要的计算,从而加快候选项集生成的速度。  相似文献   

4.
关联规则是数据挖掘的主要技术之一,是指从一个大型的数据集中发现有趣的关联或相关关系,即从数据集中识别出频繁项集,然后再利用这些频繁集创建描述关联规则的过程.频繁项集挖掘是关联规则挖掘的主要步骤,在频繁项集挖掘中,需要大量进行两个操作:判断两个k-项集是否是前k-1项相同且最后一项不同,即连接步;判断一个项集是否为另一个项集的子集,即剪枝步,通过减少连接操作和剪枝操作的循环次数,以此来提高Apriori算法的效率.  相似文献   

5.
Apriori算法的三种优化方法   总被引:38,自引:3,他引:35  
通过对Apriori算法的思想和性能的分析,认为Apriori算法存在以下三点不足:(1)由K阶频繁集生成K+1阶候选频繁集时,在K+1阶候选频繁集中过滤掉非频繁集的策略值得进一步改进;(2)连接程序中相同的项目重复比较太多,因而其效率值得进一步改进;(3)在回扫数据库时有许多不必比较的项目或事务重复比较。根据上述三点不足,提出了相应的三种优化策略来优化Apriori算法,得到一效率较高的改进Apriori算法。  相似文献   

6.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

7.
挖掘关联规则中的一种优化的Apriori算法   总被引:20,自引:0,他引:20  
对文献[1]中给出的算法以及Apriori算法的思想和性能进行了分析,提出一种优化的Apriori算法。该算法较文献[1]的算法更优.  相似文献   

8.
根据Apriori算法的原理,提出一种具有跳跃式前进与回退补齐的改进算法J_Apriori。计算频繁K项集后,求出未剪枝的候选2K项集。在满足跳跃式前进策略的条件下先求出频繁2K项集,则2K项集的所有(K+1)至(2K-1)项子集不需要再扫描庞大的数据集,可以直接加入到频繁项集中,然后再回退补齐那些不是2K项集的子集的频繁项集。改进的算法减少了扫描数据集的次数。实验表明改进的算法有效地提高了Apriori算法的效率。  相似文献   

9.
通过对Apriori算法挖掘过程进行分析,提出一种基于压缩矩阵的Apriori改进算法。该算法通过压缩矩阵和减少扫描次数来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率。并用实例说明该算法是一种有效的关联规则挖掘方法。  相似文献   

10.
关联规则反映了大量数据中项集之间的相互依存性和关联性。文章介绍了关联规则挖掘方法的原理,然后对关联挖掘及其典型算法进行分析,指出了Apriori算法的局限性在于会产生大量冗余的候选集并频繁扫描数据库。接下来给出一种改进的Apriori算法,通过减少对数据库搜索的次数,从而减少数据挖掘过程中的I/O开销。实践证明,用改进后的算法进行关联挖掘,效率优于传统的方法。  相似文献   

11.
一种新的高效Apriori算法   总被引:6,自引:2,他引:6  
Apriori算法是关联规则挖掘中的经典算法。本文针对Apriori算法的瓶颈提出一种使用先验算法产生频繁2项目集。并给出了一种简单有效的逐步缩减交易数据库的方法,加快了频繁k项目集的验证速度。新算法减小了存储空间,并显著提高了Apriori算法的效率,并改进了数据挖掘算法的性能。  相似文献   

12.
对于频繁项集挖掘,采用一种FP-数组技术来减少FP-tree的遍历时间,减少数据集的扫描次数,在此基础上提出了一种基于FP-tree进行频繁项集挖掘的FP-growth+算法,提高了算法的效率。最后的实验证明了该算法的有效性。  相似文献   

13.
改进的频繁项集挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
频繁项集挖掘是数据挖掘中的一个重要研究课题。在分析Apriori算法与FP-growth 算法特点的基础上,提出了一种改进的频繁项集挖掘算法,即索引生成频繁项集算法IGFA。IGFA算法基于Apriori算法并通过 “索引二元组”生成候选集,减免了候选集的大量冗余,实验及结果分析表明该算法有效提高了频繁项集的挖掘效率。  相似文献   

14.
基于频繁项集挖掘算法的改进与研究   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘领域中重要的研究内容,频繁项集挖掘又是关联规则挖掘中的关键问题之一。针对已有的频繁项集挖掘算法存在的问题,通过对Apriori算法的分析,提出了Inter-Apriori频繁项集挖掘算法。该算法使用交集策略减少扫描数据库的次数,从而使算法达到较高的效率。实验结果表明,Inter-Apriori算法是Apriori算法效率的2~4倍。  相似文献   

15.
应用于入侵检测系统的报警关联的改进Apriori算法   总被引:2,自引:1,他引:1  
王台华  万宇文  郭帆  余敏 《计算机应用》2010,30(7):1785-1788
在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷:需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。提出了一种一步交集操作得到最大频繁项目集的方法。支持度由交集的次数得到而无需再去扫描事务数据库,将其中一些属性进行编号能减少存储空间且方便搜索候选集列表,从而提高算法的效率。最后针对入侵检测系统形成关联规则。实验结果表明,优化后的算法能有效地提高关联规则挖掘的效率。  相似文献   

16.
关联规则挖掘中Apriori算法的研究与改进   总被引:5,自引:0,他引:5  
崔贯勋  李梁  王柯柯  苟光磊  邹航 《计算机应用》2010,30(11):2952-2955
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

17.
为了提高经典关联规则Apriori算法的挖掘效率,针对Apriori算法的瓶颈问题,提出了一种链式结构存储频繁项目集并生成最大频繁项目集的关联规则算法.该算法采用比特向量方式存储事务,生成频繁项目集的同时,把包含此频繁项目的事务作为链表连接到频繁项目之后,生成最大频繁项目集.该算法能够减小扫描事物数据库的次数和生成候选项目集的数量,从而减少了生成最大频繁项目集的时间,实验结果表明,该算法提高了运算效率.  相似文献   

18.
基于矩阵压缩的Apriori算法改进的研究   总被引:2,自引:0,他引:2       下载免费PDF全文
Apriori算法是利用关联规则进行数据挖掘的一种经典算法,但其具有产生大量候选项集和多次扫描数据库的缺点。鉴于此,提出了一种基于压缩矩阵的Apriori改进算法,通过扫描一次数据库,将其转化为布尔事务矩阵,按照相关性质对事务矩阵进行压缩,以减少算法的运算量。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

19.
分析了New-Apriori和MWFI(Mining Weighted Frequent Itemsets)算法之不足,提出了一种挖掘加权频繁项集的New-MWFI算法。该算法按属性的权值对事务进行分类,并依次求出每个类别内的加权频繁项集。由于每个类别内的频繁项集满足Apriori性质,因而可以利用Apriori算法或其他改进算法进行挖掘,从而克服了原来算法的不合理和效率低下的缺陷。实验表明该算法能更有效地从数据集中挖掘出加权频繁项集。  相似文献   

20.
挖掘最大频繁项集的优化方法   总被引:1,自引:0,他引:1  
唐瑜  王勇  杨辉华 《计算机工程与应用》2006,42(31):171-173,208
通过对Apriori算法以及已有相关研究工作的分析,从数据库维数压缩、项存储结构以及剪枝几个方面对算法进行了优化,并从理论与试验两方面验证了优化算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号