首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。  相似文献   

2.
一种Apriori算法的改进   总被引:2,自引:0,他引:2  
Apriori算法在处理关联规则分析时,当数据立方体数据稠密时,实现迭代性质将需要非常复杂的数据结构。针对上述问题,本文提出了一种改进的Apriori-ni算法,该算法没有用迭代性质来剪枝,即不基于迭代属性的算法。对Apriori算法和Apriori-ni算法进行了分析和比较,实验结果表明,当项目集很多时,Apriori-ni算法能节约计算开销,从而提高算法的效率。  相似文献   

3.
挖掘关联规则中Apriori算法的一种改进   总被引:45,自引:2,他引:45  
李绪成  王保保 《计算机工程》2002,28(7):104-105,134
对挖掘关联规则的Apriori算法关键思想以及性能进行了研究。给出了该算法的一个改进算法,该改进算法提高了原算法的性能。  相似文献   

4.
吴文妹  陈国龙 《福建电脑》2005,(4):17-17,14
本文利用频繁项集的一个性质,对Apriori算法中的生成候选项集这一步进行改进,大大减少不必要的计算,从而加快候选项集生成的速度。  相似文献   

5.
吕真  李丹 《数字社区&智能家居》2011,(6):1234-1235,1244
该文通过对Apriori算法的基本思想和性能的研究剖析,认为Apriori算法存在一些不足;并且根据这些不足提出了相应的改进UDApriori算法对经典算法进行优化,从而得到一种改进的Apriori算法,与原算法相比运算效率大大提高.  相似文献   

6.
对挖掘关联规则中的Apriori算法的一种改进   总被引:1,自引:1,他引:0  
对挖掘关联规则的Apriori算法关键思想以及性能进行了研究,给出该算法的一个改进算法,该改进算法提高了原算法的性能,并从实验中得出相关结果.  相似文献   

7.
一种改进的Apriori挖掘关联规则算法   总被引:2,自引:0,他引:2  
关联规则挖掘可以发现大量数据中项集之间有趣的联系,并已在许多领域得到了广泛的应用。但传统关联规则挖掘很少考虑数据项的重要程度,这些算法认为每个数据对规则的重要性相同,实际挖掘的结果不是很理想。为了挖掘出更具有价值的规则,文中提出了一种加权的关联规则算法,即用频度和利润来标识该项的重要性,然后对经典Apriori算法进行改进。最后用实例对改进后算法进行验证,结果证明改进后算法是合理有效的,能够挖掘出更具价值的信息。  相似文献   

8.
一种改进的Apriori挖掘关联规则算法   总被引:4,自引:1,他引:4  
关联规则挖掘可以发现大量数据中项集之间有趣的联系,并已在许多领域得到了广泛的应用。但传统关联规则挖掘很少考虑数据项的重要程度,这些算法认为每个数据对规则的重要性相同,实际挖掘的结果不是很理想。为了挖掘出更具有价值的规则,文中提出了一种加权的关联规则算法,即用频度和利润来标识该项的重要性,然后对经典Apriori算法进行改进。最后用实例对改进后算法进行验证,结果证明改进后算法是合理有效的,能够挖掘出更具价值的信息。  相似文献   

9.
关联规则挖掘是数据挖掘中的一个重要研究内容.为了高效、快速地从事务数据库中挖掘出频繁项集,针对数据挖掘的经典关联规则Apriori算法的瓶颈问题提出了改进的方法.算法将事物数据库映射到布尔型数组中,然后所有的操作都针对数组元素值展开.这样大大减少了数据库的扫描次数.算法利用数组的随机访问特性及布尔型数据的简单"与"操作,直接产生频繁项集,而不产生大量的候选项集.经理论分析和实验结果显示该算法在效率上明显优于Apriori 算法.  相似文献   

10.
一种新的高效Apriori算法   总被引:6,自引:2,他引:6  
Apriori算法是关联规则挖掘中的经典算法。本文针对Apriori算法的瓶颈提出一种使用先验算法产生频繁2项目集。并给出了一种简单有效的逐步缩减交易数据库的方法,加快了频繁k项目集的验证速度。新算法减小了存储空间,并显著提高了Apriori算法的效率,并改进了数据挖掘算法的性能。  相似文献   

11.
一种改进的Apriori算法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对Apriori算法对数据库的扫描次数过多、系统的I/O负载大和产生大量的无关中间项集等弊端,提出了一种改进的Apriori算法。该算法通过加入用户兴趣项,减少候选项集的产生;打破了传统的算法实现步骤减少了数据库的扫描次数,降低了系统I/O负载;构建了用户兴趣度模型增加了算法生成强关联规则的可读性,提高了算法的效率。实验表明,改进的Apriori算法能有效地提高运行速度和效率。  相似文献   

12.
基于Apriori算法的改进算法   总被引:2,自引:0,他引:2  
关联规则挖掘是数据挖掘研究的一项重要内容.为了快速挖掘关联规则,分析了挖掘关联规则的Apriori算法,并在此基础上给出了一种改进的算法:NApriori算法,利用频繁1项集重新组织事务数据库来挖掘关联规则,此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,实验结果表明此方法比Apriori算法有更好的性能.  相似文献   

13.
关联规则挖掘Apriori算法的改进   总被引:3,自引:0,他引:3  
在分析研究关联规则挖掘Apriori算法及其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出一种基于条件判断的新思想.改进后的算法根据条件采用了事务压缩与候选项压缩的相结合的方式,减小了不必要的开销,从而提高了挖掘速度.  相似文献   

14.
基于矩阵的改进的Apriori算法   总被引:4,自引:0,他引:4  
针对Apriori算法的不足之处,提出了基于矩阵的算法,该算法首先将事务数据库用矩阵表示出来,并对矩阵进行处理,找出包含最多项的频繁K-项集,最后再利用矩阵找出从频繁2-项集到频繁K-1项集的所有频繁项集.通过一个实例表明了该算法的具体实现过程,并与其它算法进行比较,阐述了该算法的优缺点.该算法不但充分利用了矩阵这一工具,用"与运算"的方法代替了到数据库中去查找的算法,而且大大减少了候选频繁项集的产生,从而节省了计算频繁项集的时间,提高了计算的效率.  相似文献   

15.
关联规则挖掘中对Apriori算法的研究   总被引:3,自引:1,他引:3       下载免费PDF全文
针对Apriori寻找频繁项集问题,提出了基于垂直事务列表的树形结构的挖掘算法。该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。  相似文献   

16.
关联规则挖掘Apriori算法研究综述   总被引:1,自引:0,他引:1  
关联规则挖掘是数据挖掘中的一项重要技术,Apriori算法是关联规则挖掘中的一种经典算法。在信息技术的发展过程中,随着海量数据的收集和存储,从数据库中挖掘出相关联规则的数据集变得极为重要。为此,对国内外有关Apriori算法的研究现状、算法的原理、优化算法的思想进行了探讨,同时分析了几种经典的优化算法,最后对Apriori算法未来的发展趋势进行了预测和展望。  相似文献   

17.
Apriori算法在挖掘频繁项集时需要多次扫描数据库,这样会因为频繁的IO操作而导致效率低下。为了改进算法的执行效率,提出BE-Apriori(binay encoded Apriori)算法,其充分利用了二进制数相比编程语言中各种数据结构在内存及运算速度上的优势,对事务记录进行二进制编码后加载到内存,然后利用等效的二进制数之间运算代替集合之间的运算。分析了算法性能,并利用UCI数据集中的毒蘑菇数据对BE-Apriori算法进行实验验证。结果表明BE-Apriori可以正确挖掘频繁项集,并且相比Apriori算法有着更好的性能。  相似文献   

18.
在对关联规则冗余问题产生机理分析的基础上,提出了针对于支持度阀值设置的惩罚函数和一个改进的遗传算法。该改进算法采用了频繁项分布、素因子编码、择偶和共享函数等新颖技术,使染色体总是能在频繁项密集区进行挖掘,从而对组合搜索空间进行了有效修剪。并且对事务进行了数值转换,有效地压缩了事务数据库存储空间,提高了运算速度。从实验效果来看,改进的挖掘方法在发现有价值规则的效率与精准率方面具有一定优势。  相似文献   

19.
一种结合完全连接的改进Apriori算法   总被引:4,自引:0,他引:4  
骆嘉伟  王艳  杨涛  吴君浩 《计算机应用》2006,26(5):1174-1177
基于Apriori算法原理,提出一种有效的完全连接条件,在频繁2k-项集的集合L2k进行自身Apriori连接得频繁(2k+1)-项集的同时,自身完全连接产生未剪枝的候选4k-项集;对频繁(2k+1)-项集的集合L2k+1,直接对其项集进行完全连接产生未剪枝的候选(4k+2)-项集。改进的算法减少了连接的比较次数、迭代运算次数。实验表明该算法在保证无遗漏的情况下有效地提高了Apriori算法的挖掘速度。  相似文献   

20.
Web使用挖掘中Apriori算法的改进研究   总被引:1,自引:0,他引:1  
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法.改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间.将项集有序性引入到该数组上,减少了候选项集的个数.并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率.试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号