首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 144 毫秒
1.
关联规则是挖掘并且发现大量数据集中有趣的关联或者相关联系。其中最经典的是Apriori算法,但是Apriori算法存在一定的缺陷。文章分析了Apriori算法并且对其进行改进,用一具体实例说明改进后的Apriori算法压缩了事务矩阵,缩小了搜索空间,提高Apriori算法运行效率,从而使整个日志挖掘处理过程更加快捷。  相似文献   

2.
随着科学技术的发展,人们可以更快、更方便地获取数据、保存数据,数据的量和复杂程度都是前所未见。该文对数据挖掘技术中的关联规则挖掘进行了系统的分析和研究,并在经典的Apriori算法的基础上改进了一个算法。该算法是一种基于矩阵的关联规则挖掘算法,通过扫描将数据库映射为0-1矩阵,直接在矩阵上进行运算,避免了反复扫描的过程,还对Apriori性质进行了引申和利用,对矩阵进行彻底的压缩。理论分析和实验证明了改进算法在效率上的提高。  相似文献   

3.
随着科学技术的发展,人们可以更快、更方便地获取数据、保存数据,数据的量和复杂程度都是前所未见。该文对数据挖掘技术中的关联规则挖掘进行了系统的分析和研究,并在经典的Apriori算法的基础上改进了一个算法。该算法是一种基于矩阵的关联规则挖掘算法,通过扫描将数据库映射为0-1矩阵,直接在矩阵上进行运算,避免了反复扫描的过程,还对Apriori性质进行了引申和利用,对矩阵进行彻底的压缩。理论分析和实验证明了改进算法在效率上的提高。  相似文献   

4.
通过对Apriori算法挖掘过程进行分析,提出一种基于压缩矩阵的Apriori改进算法。该算法通过压缩矩阵和减少扫描次数来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率。并用实例说明该算法是一种有效的关联规则挖掘方法。  相似文献   

5.
Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法( CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息,进而对分解事务矩阵进行关联规则挖掘;优化了由频繁k -1项目集生成频繁k项目集的连接过程;提出了一种不需要扫描数据库,利用行集“与运算”快速计算支持数的方法,改进算法挖掘所有的频繁项目集只需扫描数据库两次。实验结果表明,改进算法在最小支持度较小时效率高于Apriori算法。  相似文献   

6.
分析了并行关联规则挖掘算法存在的不足,提出了一种改进的关联规则挖掘的多核并行优化算法。该算法对Apriori算法的压缩矩阵进行了改造,并在多核平台下利用OpenMP技术和TBB技术对串行程序进行循环并行化和任务分配的并行化设计,最大限度地实现并行关联规则挖掘。  相似文献   

7.
简要地介绍了关联规则,通过对关联分析的经典算法-Apriori算法的分析,发现了经典算法Apriori算法的缺陷,给出了改进的关联规则算法FARM_New算法和基于筛选压缩的Apriori挖掘算。并将其应用到教学质量评估系统中进行对比分析。  相似文献   

8.
关联规则挖掘Apriori算法的改进与实现   总被引:11,自引:2,他引:11  
陈文庆  许棠 《微机发展》2005,15(8):155-157
Apriori算法是关联规则挖掘的一个经典算法,提高Apriori算法关联规则挖掘效率的关键是减少候选集的数量。通过分析、研究该算法的基本思想,文中提出利用Hash表存储技术对该算法进行改进,通过删除项Hash表来减少生成候选集的数量,从而提高算法的效率。实验结果表明,该改进算法能有效地提高关联规则挖掘的效率。  相似文献   

9.
基于矩阵压缩的Apriori算法改进的研究   总被引:2,自引:0,他引:2       下载免费PDF全文
Apriori算法是利用关联规则进行数据挖掘的一种经典算法,但其具有产生大量候选项集和多次扫描数据库的缺点。鉴于此,提出了一种基于压缩矩阵的Apriori改进算法,通过扫描一次数据库,将其转化为布尔事务矩阵,按照相关性质对事务矩阵进行压缩,以减少算法的运算量。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

10.
Apriori算法是关联规则挖掘的一个经典算法,提高Apriori算法关联规则挖掘效率的关键是减少候选集的数量.通过分析、研究该算法的基本思想,文中提出利用Hash表存储技术对该算法进行改进,通过删除项Hash表来减少生成候选集的数量,从而提高算法的效率.实验结果表明,该改进算法能有效地提高关联规则挖掘的效率.  相似文献   

11.
一种基于矩阵的强关联规则生成算法*   总被引:5,自引:0,他引:5  
针对Apriori算法扫描数据库的I/O代价和候选项集数目较多等问题,提出一种基于矩阵的强关联规则生成算法,算法通过将事务数据库转化为0-1矩阵后对项集按照支持度计数非递减顺序排列,从而减少候选项集的产生,同时实现置信度的高效计算。通过对实例和大数据量数据库的分析表明,该方法是有效的。  相似文献   

12.
针对智能温室大棚系统内局部传感器故障造成其不能及时有效向上推送准确数据的问题,提出将关联规则中的Apriori算法应用于故障传感器数据的预测.以温度传感器发生故障为例,首先将关联规则中传统的Apriori算法进行优化,然后将其运用到故障传感器参数的预测当中去.实验仿真表明,改进的Apriori算法能够快速的发现温室各参数之间的关联规则,从而估计出故障传感器的参数的范围,有一定的应用价值.  相似文献   

13.
一种改进的相联规则提取算法   总被引:3,自引:1,他引:3  
相联规则的提取是数据挖掘的一个重要方面。Apriori算法是提取相联规则的经典算法,效率较高。AprioriPro算法是对Apriori算法的改进,它利用大项集生成过程中的中间结果对数据库进行过滤,从而加快候选项集的计数速度,提高了整个算法的效率。该文在AprioriPro算法的基础上,首先对其基本理论进行扩展并加以证明,提出了AprioriPro2算法。该算法相对于AprioriPro算法能更多地去掉数据库中的无效元组,从而进一步提高了算法的效率。  相似文献   

14.
本文采用一种基于布尔矩阵的频繁集挖掘算法。该算法直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法的连接和剪枝,通过不断压缩支持矩阵,不仅节约了存储空间,还提高了算法的效率。  相似文献   

15.
通过对关联规则挖掘技术及经典算法Apriori和FP-growth的研究和分析,提出了一种改进的频繁项集挖掘算法。该算法利用矩阵存储数据,并结合矩阵运算求项集的支持数,有效减少了事务数据库的扫描次数;利用有序频繁项目邻接矩阵创建频繁模式树,有效减少了频繁模式树的分支和层数。通过实例分析了频繁项集的挖掘过程。  相似文献   

16.
传统的关联规则挖掘Apriori算法时间开销大,针对Apriori算法的不足之处,基于关系代数理论,利用关系矩阵及相关运算给出了搜索频繁项集的基于关系代数理论的关联规则挖掘(ORAR)算法.利用关系矩阵只需扫描数据库一次,以降低算法运行时间,挖掘频繁项集,最后通过仿真实验比较这两个算法的执行时间,讨论了数据样本量和最小支持度对算法性能的影响.通过大量的仿真实验证明改进的ORAR算法是高效的,减少了挖掘数据集中频繁项集的运行时间.  相似文献   

17.
胡波  黄宁  仵伟强 《计算机科学》2016,43(12):146-152, 162
关联规则挖掘为分析机载网络关联故障及提高排故效率提供了重要方法。分析了经典Apriori算法的局限性,结合机载网络领域知识、矩阵运算和频繁项集性质,提出一种高效的关联规则挖掘算法。应用机载网络故障具有的基于业务路径的关联特征,提出分块挖掘策略,从而实现挖掘过程的噪声隔离。提出频度矩阵和特征向量,结合矩阵特点和频繁项集性质,设计5个扫描策略,从而减少了循环次数和对比运算。与Apriori算法 相比,新算法能有效提高频繁项集的搜索速率。  相似文献   

18.
顾庆锋  宋顺林 《计算机工程与设计》2007,28(13):3060-3062,3233
Apriori算法是挖掘关联规则的经典算法.在分析该算法的基础上,在实际项目应用当中,结合SQL的特点,提出Apriori算法在SQL中的改进算法-Apriori_Sql.应用Apriori_Sql算法只需扫描一遍数据库,在数据库临时表中建立原始数据库的压缩数据映射,实验表明该算法是一种高效的关联规则的挖掘算法.  相似文献   

19.
分析了基于关联规则的数据挖掘技术原理,描述了经典的Apriori算法的原理及在实际应用中的弊端,并在此基础上运用精减频繁项集、运用多关键字排序重排频繁项集、压缩数据库方式以及算法中止条件方面对Apriori算法进行改进,并成功应用于高校学位预警系统中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号