首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
关联规则是数据挖掘中发现知识的一种有效方法,其中Apriori算法又是关联规则挖掘的经典算法。本文在分析该Apriori算法的基础上.介绍了该算法的c#实现,包括频繁集的发现和关联规则的生成,并且通过对传统购物篮数据中的频繁集进行了验证,并且得到了其中满足最小支持度和可信度的强关联规则。  相似文献   

2.
温冠华 《福建电脑》2007,(7):102-104
本文首先对数据挖掘的定义及其发展现状作了简单的介绍,然后从背景、内容、效率、复杂度等方面对基于关联规则的Apriori算法做了深入介绍,最后分析了这个算法的瓶颈问题,并就此问题提出了改进方案.  相似文献   

3.
关联规则是数据挖掘中发现知识的一种有效方法,其中Apriori算法又是关联规则挖掘的经典算法。本文在分析该Apriori算法的基础上,介绍了该算法的C#实现,包括频繁集的发现和关联规则的生成,并且通过对传统购物篮数据中的频繁集进行了验证,并且得到了其中满足最小支持度和可信度的强关联规则。  相似文献   

4.
关联规则之Apriori算法的改进   总被引:3,自引:0,他引:3  
钱冬云 《福建电脑》2006,(3):99-100
关联规则是数据挖掘的重要研究内容。Apriori算法是关联规则之经典算法。本文在分析经典Apriori算法的基础上.提出了改进型的Apriori算法。新算法采用事务压缩技术,提高了数据挖掘的效率,具有一定的实用性。  相似文献   

5.
挖掘关联规则中的Apriori算法的研究   总被引:19,自引:1,他引:19  
文章是基于大型销售数据库研究了关联规则挖掘问题,分析和探讨了Apriori算法,并给出了该算法的实现思想,同时通过例子说明算法的执行过程。  相似文献   

6.
张凤云 《数字社区&智能家居》2010,6(22):6268-6269,6279
为有助于人们深入研究关联规则挖掘技术,该文给出了关联规则及其相关术语的定义,阐述了关联规则Apriori算法,总结了经典算法的优化方案以及关联规则在经典算法基础上的扩展应用。  相似文献   

7.
数据挖掘能为决策者提供许多重要的、极有价值的信息或知识,从而产生不可估量的效益。文章通过实例论述了Apriori算法进行数据挖掘应用的价值。  相似文献   

8.
Apriori算法是关联规则挖掘的一个经典算法,提高Apriori算法关联规则挖掘效率的关键是减少候选集的数量.通过分析、研究该算法的基本思想,文中提出利用Hash表存储技术对该算法进行改进,通过删除项Hash表来减少生成候选集的数量,从而提高算法的效率.实验结果表明,该改进算法能有效地提高关联规则挖掘的效率.  相似文献   

9.
关联规则挖掘Apriori算法的改进与实现   总被引:11,自引:2,他引:11  
陈文庆  许棠 《微机发展》2005,15(8):155-157
Apriori算法是关联规则挖掘的一个经典算法,提高Apriori算法关联规则挖掘效率的关键是减少候选集的数量。通过分析、研究该算法的基本思想,文中提出利用Hash表存储技术对该算法进行改进,通过删除项Hash表来减少生成候选集的数量,从而提高算法的效率。实验结果表明,该改进算法能有效地提高关联规则挖掘的效率。  相似文献   

10.
关联规则反映了大量数据中项集之间的相互依存性和关联性。文章介绍了关联规则挖掘方法的原理,然后对关联挖掘及其典型算法进行分析,指出了Apriori算法的局限性在于会产生大量冗余的候选集并频繁扫描数据库。接下来给出一种改进的Apriori算法,通过减少对数据库搜索的次数,从而减少数据挖掘过程中的I/O开销。实践证明,用改进后的算法进行关联挖掘,效率优于传统的方法。  相似文献   

11.
针对安全审计系统中存在的智能程度低、日志信息没有充分利用的问题,提出一个基于关联规则挖掘的安全审计系统。该系统充分利用已有审计日志,结合数据挖掘技术,建立用户及系统的行为模式数据库,做到及时发现异常情况,提高了计算机的安全性。在传统Apriori算法的基础上提出一种改进的E-Apriori算法,该算法可以缩小待扫描事务集合的范围,降低算法的时间复杂度,提高运行效率。实验结果表明基于关联规则挖掘的审计系统对攻击类型的识别能力提升在10%以上,改进的E-Apriori算法相比经典Apriori算法和FP-GROWTH算法在性能上得到了提高,特别是在大型稀疏数据集中最高达到51%。  相似文献   

12.
关联规则反映了大量数据中项集间的相互依存性和关联性。Apriori算法是关联规则挖掘中的经典算法,目前已有很多的改进版本,但大多存在多次扫描数据库,项集生成瓶颈和模式匹配频繁的问题,算法效率比较低。本文深入的分析研究关联规则Apriori算法,改进候选频繁项目集的连接和剪枝策略,改进对事务的处理方式,减少模式匹配所需的时间开销,并给出了改进算法。  相似文献   

13.
本文采用一种基于布尔矩阵的频繁集挖掘算法。该算法直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法的连接和剪枝,通过不断压缩支持矩阵,不仅节约了存储空间,还提高了算法的效率。  相似文献   

14.
Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法( CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息,进而对分解事务矩阵进行关联规则挖掘;优化了由频繁k -1项目集生成频繁k项目集的连接过程;提出了一种不需要扫描数据库,利用行集“与运算”快速计算支持数的方法,改进算法挖掘所有的频繁项目集只需扫描数据库两次。实验结果表明,改进算法在最小支持度较小时效率高于Apriori算法。  相似文献   

15.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。  相似文献   

16.
关联规则挖掘Apriori算法的改进   总被引:3,自引:0,他引:3  
在分析研究关联规则挖掘Apriori算法及其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出一种基于条件判断的新思想.改进后的算法根据条件采用了事务压缩与候选项压缩的相结合的方式,减小了不必要的开销,从而提高了挖掘速度.  相似文献   

17.
基于HMT和哈希树的Apriori并行算法研究   总被引:1,自引:0,他引:1  
为了进一步提高基于HMT和哈希树的Apriori算法的性能,提出了一种基于独立内存并行环境的并行化方案,充分利用空闲的计算资源来提高关联规则数据挖掘的效率.将原始数据集平均分配到并行环境中的各个子计算节点中,在各个子计算节点中并行地进行关联规则支持度计数,并从各个子计算节点中收集合并支持度计数的结果,得到目标频繁项集,进而实现Apriori算法的并行化.实验结果表明,该并行化方案可以很好地提高原算法的效率.  相似文献   

18.
为解决传统数据挖掘算法在大量数据处理时面临的内存占用、计算性能等方面的问题,基于Hadoop平台,应用HBase文件存储系统对海量数据分布式存储以及Map Reduce框架进行分布式计算,实现Apriori经典数据挖掘算法。通过对已实现的Apriori算法进行优化,引入FIS-IS算法思想,从数据库扫描次数和容量消减方向进行改进。提出针对数据本身进行频繁预选项生成方法与对于频繁预选项剪枝步骤进行分组检索的优化方法。实验结果验证了改进算法对算法运行具有良好的优化效果。  相似文献   

19.
一种Apriori算法的改进   总被引:2,自引:0,他引:2  
Apriori算法在处理关联规则分析时,当数据立方体数据稠密时,实现迭代性质将需要非常复杂的数据结构。针对上述问题,本文提出了一种改进的Apriori-ni算法,该算法没有用迭代性质来剪枝,即不基于迭代属性的算法。对Apriori算法和Apriori-ni算法进行了分析和比较,实验结果表明,当项目集很多时,Apriori-ni算法能节约计算开销,从而提高算法的效率。  相似文献   

20.
为了提高经典关联规则Apriori算法的挖掘效率,针对Apriori算法的瓶颈问题,提出了一种链式结构存储频繁项目集并生成最大频繁项目集的关联规则算法.该算法采用比特向量方式存储事务,生成频繁项目集的同时,把包含此频繁项目的事务作为链表连接到频繁项目之后,生成最大频繁项目集.该算法能够减小扫描事物数据库的次数和生成候选项目集的数量,从而减少了生成最大频繁项目集的时间,实验结果表明,该算法提高了运算效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号