首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
Apriori算法是一种经典的关联规则发现算法。针对Web日志挖掘的特点,在Apriori算法基础上给出一种适用于动态事务数据库挖掘的关联规则发现算法,并对比该算法与Apriori算法的区别。将该算法应用到网站的日志挖掘中,实验证明该算法的性能较原算法有一定的提高。  相似文献   

2.
基于Apriori算法的改进算法   总被引:2,自引:0,他引:2  
关联规则挖掘是数据挖掘研究的一项重要内容.为了快速挖掘关联规则,分析了挖掘关联规则的Apriori算法,并在此基础上给出了一种改进的算法:NApriori算法,利用频繁1项集重新组织事务数据库来挖掘关联规则,此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,实验结果表明此方法比Apriori算法有更好的性能.  相似文献   

3.
基于矩阵的关联规则挖掘算法   总被引:9,自引:0,他引:9  
文章通过对Apriori算法的思想和性能的分析,提出一种基于矩阵的关联规则挖掘算法。新算法直接通过对布尔矩阵的列向量进行对位“与”运算产生频繁项集,有效地解决了Apriori算法迭代产生频繁项集的瓶颈问题。试验结果表明,新算法比Apriori算法具有更高的效率和性能。  相似文献   

4.
王丹  张浩  陆剑峰 《计算机工程》2006,32(24):29-30
关联规则挖掘是数据挖掘中的重要研究内容之一,Apriori算法是其中的经典算法,而频繁集的提取问题则是Apriori算法中的关键。该文对Apriori算法性能进行了分析,针对其中的连接步和剪枝步实施了改进,提出了MApriori算法。并通过算法仿真实验对这两种算法进行了比较,结果证明改进后的算法加快了高项频繁集的产生速度,从而提高了挖掘的效率。  相似文献   

5.
基于Apriori&Fp—growth的频繁项集发现算法   总被引:6,自引:3,他引:3  
关联规则挖掘是数据挖掘中功能之一,而高效的关联规则挖掘算法研究引起了许多科研人员的兴趣.其中频繁项集的发现是关联规则挖掘算法中占比重最高、代价最大的步骤.从分析Apriori算法与Fp-growth算法性能的优缺点的基础上,提出了一种新的频繁项集发现算法:FA算法,该算法吸取了Apriori算法与Fp-growth算法的优点,通过实验表明该算法有较高的性能,且内存开销较少.  相似文献   

6.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

7.
Apriori算法低频规则的有效性及实现   总被引:1,自引:0,他引:1  
针对经典Apriori算法基于全局、高频两个条件的缺陷,指出事务数据库低频规则的有效性,并通过对C4.5决策树的规则构造,进一步证明事务数据库存在低频规则,在此基础上,给出了一种Apriori低频规则挖掘算法。该算法与经典的Apriori算法兼容,但不是对Apriori算法简单的扩展,而是从理论上打破了Apriori算法基于全局和高频两个条件。最后通过实例用Apriori低频规则挖掘算法和C4.5算法对实例数据库进行挖掘,证明两者的一致性和Apriori低频规则的有效性,同时也证明了Apriori低频规则挖掘算法的有效性。  相似文献   

8.
对挖掘关联规则的Apriori算法关键思想进行了研究,给出该算法的一个改进算法,提高了原算法的性能。  相似文献   

9.
挖掘关联规则中Apriori算法的一种改进   总被引:45,自引:2,他引:45  
李绪成  王保保 《计算机工程》2002,28(7):104-105,134
对挖掘关联规则的Apriori算法关键思想以及性能进行了研究。给出了该算法的一个改进算法,该改进算法提高了原算法的性能。  相似文献   

10.
一种新的高效Apriori算法   总被引:6,自引:2,他引:6  
Apriori算法是关联规则挖掘中的经典算法。本文针对Apriori算法的瓶颈提出一种使用先验算法产生频繁2项目集。并给出了一种简单有效的逐步缩减交易数据库的方法,加快了频繁k项目集的验证速度。新算法减小了存储空间,并显著提高了Apriori算法的效率,并改进了数据挖掘算法的性能。  相似文献   

11.
一种基于矩阵的关联规则挖掘新算法   总被引:9,自引:1,他引:8  
本文针时大型交易事务数据库数据间发现关联规则问题,提出了一个新的关联规则挖掘算法,BOM(Base ON matrix算法。该算法不同于经典的Apriori算法,对于大型交易事务数据库,具有较Apriori算法更加优越的性能。  相似文献   

12.
一种基于事务压缩的关联规则优化算法   总被引:10,自引:0,他引:10  
通过对Apriori算法挖掘过程进行分析,提出了一种基于事务压缩的关联规则挖掘算法.该算法充分利用Apriori性质,通过减少候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率.并在Apriori算法的基础上设计了Apriori改进算法.  相似文献   

13.
关联规则挖掘的矩阵算法   总被引:19,自引:0,他引:19  
关联挖掘作法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显,文章提出了一种新的关联规则挖掘算法:矩阵算法。同Apriori算法相比较,该算法能直接查找高次频繁项集,可以有效地屏蔽Aptiori算法性能瓶颈试验结果表明,当频繁项级较高时该算法比Apriori具有更高的执行效率和性能,并具有良好的可行性。  相似文献   

14.
该文根据用户的Web访问路径应用关联规则和类Apriori算法挖掘出该用户的频繁访问路径,通过对Apriori算法和目前针对提高该算法效率的各种优化技术的详细分析和研究,对类Apriori算法进行了改进,提出了基于筛选压缩的类Apriori挖掘算法,并进行了模拟实验,比较结果显示基于筛选压缩的类Apriori挖掘算法挖掘用户频繁遍历路径的效率高于类Apriori算法,最终可获取用户的频繁遍历路径。  相似文献   

15.
对挖掘关联规则中的Apriori算法的一种改进   总被引:1,自引:1,他引:0  
对挖掘关联规则的Apriori算法关键思想以及性能进行了研究,给出该算法的一个改进算法,该改进算法提高了原算法的性能,并从实验中得出相关结果.  相似文献   

16.
Apriori算法在挖掘频繁项集时需要多次扫描数据库,这样会因为频繁的IO操作而导致效率低下。为了改进算法的执行效率,提出BE-Apriori(binay encoded Apriori)算法,其充分利用了二进制数相比编程语言中各种数据结构在内存及运算速度上的优势,对事务记录进行二进制编码后加载到内存,然后利用等效的二进制数之间运算代替集合之间的运算。分析了算法性能,并利用UCI数据集中的毒蘑菇数据对BE-Apriori算法进行实验验证。结果表明BE-Apriori可以正确挖掘频繁项集,并且相比Apriori算法有着更好的性能。  相似文献   

17.
关联规则是数据挖掘研究的一个重要分支。阐述了关联规则的基本概念、关联规则挖掘的基本模型;详细分析了关联规则挖掘的经典算法-Apriori算法,Apriori算法核心思想、性能分析及其改进技术。  相似文献   

18.
数据挖掘中关联规则的研究   总被引:2,自引:1,他引:1  
通过对Apriori算法的基本思想和性能的研究分析,指出Apriori算法存在一些不足.针对这些不足提出了采用比较支持计数合并频繁项集和减少扫描数据库记录个数两种方法的CRApriori算法,以提高挖掘效率.  相似文献   

19.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。  相似文献   

20.
关联规则是挖掘并且发现大量数据集中有趣的关联或者相关联系。其中最经典的是Apriori算法,但是Apriori算法存在一定的缺陷。文章分析了Apriori算法并且对其进行改进,用一具体实例说明改进后的Apriori算法压缩了事务矩阵,缩小了搜索空间,提高Apriori算法运行效率,从而使整个日志挖掘处理过程更加快捷。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号