首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
关联规则挖掘是数据挖掘的一个重要分支,但随着数据的快速增长,传统关联规则挖掘算法不能很好地适应大数据的要求,需要在分布式、并行计算的平台上寻找突破。Spark是专门为大数据处理而设计的一个适合迭代运算的并行计算模型,相比MapReduce具有更高效、充分利用内存、更适合迭代计算和交互式处理的优点。对已有的基于Spark的并行关联规则挖掘算法进行了分类和综述,并总结了各自的优缺点和适用范围,为下一步的研究提供参考。  相似文献   

2.
3.
关联规则挖掘的研究及对Apriori算法的改进   总被引:11,自引:1,他引:11       下载免费PDF全文
本文对关联规则挖掘问题进行了介绍,并对其作了形式化描述;对Apriori算法进行了分析,针对该算法的缺点,提出改进算法apriori.new。改进的算法避免了模式匹配,减小了访问数据库的次数,从而提高了挖掘速度。  相似文献   

4.
为了提供一种更加准确高效的关联规则算法,在传统的Apriori算法的基础上引入分而治之的理念和加权的思想.先把数据库分成互不相交的块,根据需求分析从每一个块中产生用户感兴趣的子集,把所有的子集合并成挖掘对象,再利用普通的关联规则算法产生频繁项集,最后在该项集的基础上产生加权频繁项集.该算法基本上克服了传统Apriori算法的缺点,从而大大地提高了运算效率,最大限度解决了"项集生成瓶颈"问题,并且使得生成的关联规则更加科学、准确.  相似文献   

5.
关联规则挖掘算法的改进   总被引:2,自引:1,他引:2  
为了提供一种更加准确高效的关联规则算法,在传统的Apriori算法的基础上引入分而治之的理念和加权的思想。先把数据库分成互不相交的块,根据需求分析从每一个块中产生用户感兴趣的子集,把所有的子集合并成挖掘对象,再利用普通的关联规则算法产生频繁项集,最后在该项集的基础上产生加权频繁项集。该算法基本上克服了传统Apriori算法的缺点,从而大大地提高了运算效率,最大限度解决了“项集生成瓶颈”问题,并且使得生成的关联规则更加科学、准确。  相似文献   

6.
针对在关联规则中的Apriori算法进行了深入研究的基础上,提出了一种基于压缩矩阵的关联规则挖掘算法(CMApriori算法)。该算法只需扫描一次数据库,在矩阵上采用事务压缩和项目压缩技术,节省了数据占用的内存空间。在对建立好的压缩矩阵上只需进行简单的计数运算即可得到频繁项集。仿真实验证明:该算法与Apriori算法相比,运算效率大大提高。  相似文献   

7.
8.
关联规则挖掘的矩阵算法   总被引:19,自引:0,他引:19  
关联挖掘作法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显,文章提出了一种新的关联规则挖掘算法:矩阵算法。同Apriori算法相比较,该算法能直接查找高次频繁项集,可以有效地屏蔽Aptiori算法性能瓶颈试验结果表明,当频繁项级较高时该算法比Apriori具有更高的执行效率和性能,并具有良好的可行性。  相似文献   

9.
利用电商平台推荐算法难以准确建立用户关系网络,为保证平台内商品推荐的准确性,研究关联规则挖掘Apriori算法在农产品电商平台推荐中的应用方法。首先,计算具备相似性的用户关系强度,得到词语概率的分布规律,通过时间综合相似度获得多个主题内容的演化结果;其次,基于关联规则挖掘Apriori算法建立电商平台推荐模型,得到新的商品推荐算法;最后,以平均绝对误差与均方根误差作为推荐算法精度的指标,进行实验对比分析。实验结果表明,在不同的特征维数下,关联规则挖掘Apriori算法的平均绝对误差与均方根误差均为相同条件下的最小值,可见该方法在农产品电商平台推荐中最准确,其推荐精度最高。  相似文献   

10.
挖掘关联规则中的Apriori算法的研究   总被引:19,自引:1,他引:19  
文章是基于大型销售数据库研究了关联规则挖掘问题,分析和探讨了Apriori算法,并给出了该算法的实现思想,同时通过例子说明算法的执行过程。  相似文献   

11.
基于关联规则挖掘领域的Apriori算法的优化研究   总被引:2,自引:0,他引:2  
挖掘关联规则是数据挖掘领域的一个重要研究课题,在挖掘数据间的关联性时具有非常重要的意义。本文在分析关联规则挖掘及Apriori算法的基础上,从压缩扫描数据集及提高剪枝效率等方面对算法进行了优化改进,从而达到了降低消耗、提高算法效率的目的。最后,通过实例对优化的Apriori算法作了详细介绍。  相似文献   

12.
本文提出一种基于兴趣集和权的算法(IWA),由用户提出他们感兴趣的项目并在数据库中找出与之相关的项目,通过给每个项目赋以不同权值来标识项目不同的重要性,从而可以挖掘出Apriori算法挖不出但却极具价值的规则。  相似文献   

13.
基于矩阵的关联规则挖掘算法   总被引:9,自引:0,他引:9  
文章通过对Apriori算法的思想和性能的分析,提出一种基于矩阵的关联规则挖掘算法。新算法直接通过对布尔矩阵的列向量进行对位“与”运算产生频繁项集,有效地解决了Apriori算法迭代产生频繁项集的瓶颈问题。试验结果表明,新算法比Apriori算法具有更高的效率和性能。  相似文献   

14.
基于矩阵与图的关联规则挖掘   总被引:5,自引:0,他引:5  
提出了一种新的算法,该算法是在基于图的关联规则挖掘的基础上进行研究,并提出改进。该算法与传统的关联规则挖掘算法Apfiofi算法相比,具有一定的优势,如复杂度低,无需多次扫描数据库等。  相似文献   

15.
关联规则挖掘是数据挖掘的一项重要技术,它主要是通过频繁项集挖掘得到关联规则。基于云计算的MapReduce模型的数据挖掘算法可以提高挖掘的效果及性能。  相似文献   

16.
对挖掘关联规则的Apriori算法关键思想进行了研究,给出该算法的一个改进算法,提高了原算法的性能。  相似文献   

17.
最简关联规则及其挖掘算法   总被引:3,自引:0,他引:3       下载免费PDF全文
李杰  徐勇  王云峰  王友 《计算机工程》2007,33(13):46-48
传统关联规则挖掘算法往往产生过多规则而难以被决策者所采用。针对该问题,文章从应用的角度提出了最简关联规则,其特点是后项只包括一种产品,同时追求规则前项产品项数的最小化,在此基础上给出了一种最简关联规则挖掘算法。利用该算法得到的最简关联规则集包括的规则数量大为减少且能得出与全部关联规则集相同的决策,避免了大量的冗余挖掘,提高了挖掘效率和应用效果。  相似文献   

18.
互联网技术在带给我们一个信息爆炸时代的同时,也极大地增加了从浩瀚数据堆里寻找有用知识的困难程度。面对不断拓展的数据规模,对海量信息的搜索、管理以及实时处理能力将面临严峻的挑战。文章主要介绍基于Apriori算法关联规则的具体应用。  相似文献   

19.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,这些重要信息是关于这些数据的整体特征描述以及对其发展趋势的预测,对决策的制定有着重要的参考价值。主要介绍了数据挖掘和关联规则挖掘的概念,并对数据挖掘经典算法Apriori的进行了分析与改进,算法的改进可以有效地减少对数据库的扫描次数,使挖掘的效率更好更快。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号