首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
林燕芬 《福建电脑》2013,29(7):94-96
针对目前磨削数据库中海量数据问题,本文将数据挖掘技术中的Apriori算法应用到磨削数据库的数据优化中,利用该算法找出频繁出现的检索组合得到最优的组合,从而为优化数据提供有用的信息,提高数据共享度,对提高磨削数据库的检索有一定的指导意义。  相似文献   

2.
关联规则算法是数据挖掘的核心。本文首先介绍了关联规则的定义,接着在现有Apriori算法的基础上分析了存在的不足,并提出了一个关联规则算法的改进模式,从而提高Apriori算法的效率。  相似文献   

3.
挖掘关联规则中的Apriori算法的研究   总被引:19,自引:1,他引:19  
文章是基于大型销售数据库研究了关联规则挖掘问题,分析和探讨了Apriori算法,并给出了该算法的实现思想,同时通过例子说明算法的执行过程。  相似文献   

4.
关联规则是数据挖掘的主要技术之一,是指从一个大型的数据集中发现有趣的关联或相关关系,即从数据集中识别出频繁项集,然后再利用这些频繁集创建描述关联规则的过程.频繁项集挖掘是关联规则挖掘的主要步骤,在频繁项集挖掘中,需要大量进行两个操作:判断两个k-项集是否是前k-1项相同且最后一项不同,即连接步;判断一个项集是否为另一个项集的子集,即剪枝步,通过减少连接操作和剪枝操作的循环次数,以此来提高Apriori算法的效率.  相似文献   

5.
关联规则算法是数据挖掘的核心。本文首先介绍了关联规则的定义,接着在现有Apfiori算法的基础上分析了存在的不足,并提出了一个关联规则算法的改进模式,从而提高Apriori算法的效率。  相似文献   

6.
基于等价类和最大完全图集聚类的关联规则发现算法   总被引:5,自引:0,他引:5  
关联规则的发现是数据挖掘中的一个重要问题,本文提供了一个基于等价类和最大完全图集聚类的关联规则的发现算法。  相似文献   

7.
文章首先讨论了本课题研究的背景以及关联规则的相关理论基础,然后根据图书馆借阅数据的特点进行数据预处理,包括数据的导入和提取,最终实现了事务数据库的建立,在此之后是基于Apriori算法的图书借阅数据关联规则的实现,并针对结果分析此课题的意义。文章最后是总结与展望。  相似文献   

8.
基于矩阵的Apriori算法的优化   总被引:1,自引:0,他引:1  
在数据挖掘中关联规则挖掘是很重要的一个方面,而Apriori算法是进行关联规则挖掘的经典算法。本文首先分析了经典Apriori算法,然后利用矩阵的思想对其改进,并利用事务压缩的思想对矩阵进行压缩。改进后的算法明显提高了Apriori算法的效率。  相似文献   

9.
随着时代的进步和科学技术的发展,数据资源越来越多,但是信息贫乏的困境却依然无法摆脱,于是如今开始大力对新的数据分析方法和工具进行查找,从海量数据中将有用知识给提取出来。针对如今Apriori算法效率的瓶颈,就需要提出策略来改进本算法。本文简要分析了基于数据挖掘关联规则Apriori算法的优化对策,希望可以提供一些有价值的参考意见。  相似文献   

10.
关联规则Apriori算法   总被引:1,自引:0,他引:1  
阐述了关联规则的基本概念、Apriori算法及其实验结果分析,并描述了Apriori算法的性能瓶颈与改进策略。  相似文献   

11.
关联规则挖掘算法中的Apriori算法利用查找频繁项集来发现数据集中的关联规则,算法思路简单容易实现;但在由k-1次频繁项集生成k次频繁项集时需反复查找数据库,效率较低,在寻找高次频繁项集时其低效性更加明显;矩阵算法是通过直接查找高次频繁项集,避免了反复查找数据库,但要存储大量的非频繁项集,且查找低次频繁项集速度较慢。文中提出的矩阵等价类算法,利用等价关系进一步降低矩阵算法的时间空间复杂度,然后通过项目相似度直接求取所有最大频繁项集。实验结果证明了算法的可行性、高效性。  相似文献   

12.
基于十字链表的Apriori改进算法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对Apriori算法中存在的不足,提出一种把事务数据库映射到十字链表中的改进算法。该算法可以减少连接数据库的次数及事务记录的扫描次数。Apriori算法与改进算法的性能对比分析表明,改进算法能有效提高执行效率。  相似文献   

13.
互联网技术在带给我们一个信息爆炸时代的同时,也极大地增加了从浩瀚数据堆里寻找有用知识的困难程度。面对不断拓展的数据规模,对海量信息的搜索、管理以及实时处理能力将面临严峻的挑战。文章主要介绍基于Apriori算法关联规则的具体应用。  相似文献   

14.
随着人民生活水平的不断提高,肿瘤疾病的人数在不断增多,其中肺癌是21世纪严重危害人类健康的重大疾病。面向肺癌电子病历如此庞大的数据量时,传统Apriori算法的串行计算方式需要频繁扫描数据库,会消耗巨大的内存占用量。对此,提出一种基于改进Apriori算法的肺癌风险评估因素分析的方法。运用Hadoop平台实现并行Apriori算法的优化,应用HBase文件存储系统对海量数据分布式存储以及Map Reduce框架进行分布式计算,最后给出基于Hadoop平台和MapReduce分布式计算模型的执行流程和测试结果。实验结果表明,改进算法在处理大数据及时有较好的执行效率以及良好的可扩展性,得出了肺癌的疾病模式与致病因素之间的隐匿规则,从而验证了改进后的Apriori算法对于辅助肺癌临床实验具有重要的意义。  相似文献   

15.
在所有的关联规则的挖掘算法中Apriori算法是最为经典的一个,但Apriofi算法有两个缺陷,即要扫描多次数据库以及生成大量的候选集。本文提出一种利用对项进行编码的方法对该算法进行改进,通过对项编码来减少扫描数据库次数并通过删除项来减少生成候选集的数量,从而提高算法的效率。相同条件下的实验结果表明,该优化后的算法能有效地提高关联规则挖掘的效率。  相似文献   

16.
 Apriori算法在搜索频繁项集过程中,通常需要对数据库进行多次的重复扫描和产生大量无用的候选集,针对此问题提出一种基于矩阵约简的Apriori改进算法。该算法只需扫描一次数据库,将数据库信息转换成布尔矩阵,根据频繁k-项集的性质推出的结论来约简数据结构,有效地降低无效候选项集的生成规模。通过对已有算法的对比,验证该算法能有效地提高挖掘频繁项集的效  相似文献   

17.
探讨了Apriori算法的改进问题,提出了一种基于BIT存贮运算的关联规则挖掘算法。该算法可把相当大的数据集读入内存,并在内存中使用高效的BIT运算快速进行计数,同时简化了Apriori算法中候选项集的计算,由直接判断生成频繁项集,大大地减少了ee间变量及其存贮的时间和空间,提高了关联规则挖掘的速度和效率。  相似文献   

18.
一种改进的Apriori挖掘关联规则算法   总被引:2,自引:0,他引:2  
关联规则挖掘可以发现大量数据中项集之间有趣的联系,并已在许多领域得到了广泛的应用。但传统关联规则挖掘很少考虑数据项的重要程度,这些算法认为每个数据对规则的重要性相同,实际挖掘的结果不是很理想。为了挖掘出更具有价值的规则,文中提出了一种加权的关联规则算法,即用频度和利润来标识该项的重要性,然后对经典Apriori算法进行改进。最后用实例对改进后算法进行验证,结果证明改进后算法是合理有效的,能够挖掘出更具价值的信息。  相似文献   

19.
挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一.在对关联规则挖 掘中基于Apriori算法的改进算法进行深入分析和研究后,本文根据Apriori算法的不足,提出了一种改进策略,从而得到一种优化的Apriori算法.最后,对频繁项集挖掘算法的发展方向进行了初步的探讨.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号