首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
随着数据量的增长,如何快速有效发现频繁项集已成为挖掘关联规则的核心问题,而并行计算和闭频繁项集分别是一种处理大量数据直接有效的方法和频繁项集的无失真信息最小集合。分析一些经典闭频繁项集算法和并行关联规则算法及其不足,提出一种基于多核微机的并行闭频繁项集挖掘算法,提高了闭频繁项集挖掘的效率。  相似文献   

2.
分析了并行关联规则挖掘算法存在的不足,提出了一种改进的关联规则挖掘的多核并行优化算法。该算法对Apriori算法的压缩矩阵进行了改造,并在多核平台下利用OpenMP技术和TBB技术对串行程序进行循环并行化和任务分配的并行化设计,最大限度地实现并行关联规则挖掘。  相似文献   

3.
聚类后的关联规则快速更新算法研究*   总被引:1,自引:0,他引:1  
关联规则和聚类分析是数据挖掘中重要的研究课题。通过对关联规则挖掘算法Apriori算法进行分析与研究,指出了其在实用中存在的两个主要问题。鉴于此,在分析聚类分析和关联规则两种挖掘算法的基础上,讨论了将这两种独立的挖掘方法集成起来的联合挖掘,使其可以有效地压缩数据规模。给出了聚类后的关联规则快速更新算法描述。实验结果表明,算法性能优良,提高了数据挖掘执行效率。  相似文献   

4.
为了减少并行挖掘关联规则过程中产生的网络流量及同步次数,提高挖掘效率,在Tree-DM算法的基础上,提出了不生成候选项目集的并行关联规则挖掘算法Ptree-DM。给出了Ptree-DM算法的执行示例,并对该算法的效率进行了分析和讨论。  相似文献   

5.
分布式环境下挖掘约束性关联规则的算法研究   总被引:2,自引:0,他引:2  
关联规则是数据挖掘的重要研究内容。基于约束的关联规则挖掘可以促进交互式探查与分析。该文主要研究了分布式环境中挖掘约束性关联规则的问题。在并行关联规则挖掘算法CD和约束性关联规则挖掘算法Direct的基础上,提出了一种新的分布式挖掘约束性关联规则算法DMA_IC。该算法对于解决分布式挖掘约束性关联规则的问题是十分有效的。同时,文章还对DMA_IC算法的通信性能进行了讨论。  相似文献   

6.
提出一种基于人工免疫方法的关联规则提取算法,将人工免疫方法应用于关联规则的提取。本算法采取“随机并行搜索”策略,快速识别出候选关联规则,整个挖掘过程最后只需扫描数据库一遍,也不需生成大量的频繁项目集,从而提高关联规则挖掘的总体性能。  相似文献   

7.
典型关联规则挖掘算法的分析与比较   总被引:3,自引:0,他引:3  
冯洁  陶宏才 《微机发展》2007,17(3):121-124
关联规则的发现是数据挖掘的一个重要方面,目前许多研究人员正致力于关联规则的快速开采算法的研究。文中介绍了几种典型的开采大型事务数据库中所有关联规则的算法,特别针对算法过程中产生候选频繁项集的大小和所需扫描事务数据库的次数这两个影响关联规则挖掘效率的关键问题,分析各个算法采用的解决策略及相应的局限性,并比较它们的时间效率和空间效率。最后展望了关联规则挖掘算法的研究方向。  相似文献   

8.
典型关联规则挖掘算法的分析与比较   总被引:6,自引:0,他引:6  
关联规则的发现是数据挖掘的一个重要方面,目前许多研究人员正致力于关联规则的快速开采算法的研究。文中介绍了几种典型的开采大型事务数据库中所有关联规则的算法,特别针对算法过程中产生候选频繁项集的大小和所需扫描事务数据库的次数这两个影响关联规则挖掘效率的关键问题,分析各个算法采用的解决策略及相应的局限性,并比较它们的时间效率和空间效率。最后展望了关联规则挖掘算法的研究方向。  相似文献   

9.
基于规则量和提取率度量标准,提出一种使用并行克隆退火遗传策略的关联规则挖掘算法。该算法结合了遗传算法、模拟退火算法和免疫克隆算法的优点,采用克隆、变异和交叉操作获取问题的最优解。理论分析和仿真实验结果表明,该算法能高效、快速地解决关联规则挖掘问题。  相似文献   

10.
为改进现有模糊关联规则挖掘算法的不足,提出了一种基于线性链表的模糊关联规则挖掘算法。算法利用线性链表只存储有用的事务数据库信息,并不断利用前期的运算结果对之进行简化,减少了数据的存储开销及扫描时间,降低了算法的时间复杂度,提高了算法的效率。比较分析以及实验表明,该算法对于挖掘模糊关联规则是快速而有效的。  相似文献   

11.
采掘关联规则的高效并行算法   总被引:33,自引:1,他引:32  
采掘关联规则是数据采掘领域的一个重要问题。文中对采掘关联规则问题进行了简单的回顾,给出了一种提高顺序采掘关联规则效率的方法;分析了已有并采掘关联规则算法的优缺点;设计了一个效率较高的并行采掘关联规则的算法PMAR;并与其它相应算法进行了比较,实验证明,算法PMAR是有效的。  相似文献   

12.
陈涛  张玮 《微机发展》2007,17(1):139-141
在研究关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,并给出了并行数据挖掘的计算框架。提出了一个以计算服务器为中心节点的并行挖掘算法,可以发挥各局部节点的优势,无需各局部节点进行通信,减少了各局部节点的通信负荷。通过理论分析和实验数据验证,该算法具有较好的可扩展性和海量处理能力,特别是在节点数目较多的情况下更显示出优势。  相似文献   

13.
关联规则挖掘是最常用、最重要的数据挖掘任务之一,经典的关联规则挖掘算法有Apriori、FP-Growth、Eclat等。随着数据的爆炸式增长,传统的算法已不能适应大数据挖掘的需要,需要分布式、并行的关联规则挖掘算法来解决上述问题。MapReduce是一种流行的分布式并行计算模型,因其使用简单、伸缩性好、自动负载均衡和自动容错等优点,得到了广泛的应用。本文对已有的基于MapReduce计算模型的并行关联规则挖掘算法进行了分类和综述,对其各自的优缺点和适用范围进行了总结,并对下一步的研究进行了展望。  相似文献   

14.
并行多层关联规则的挖掘算法研究   总被引:1,自引:0,他引:1  
王华秋  王越  曹长修 《计算机应用》2006,26(2):373-0375
在分析了单数据库多层关联规则算法SMAM算法的基础上,为了提高现有算法的效率,改善内存的使用率,提出了两种并行多层关联规则算法PMAM L和PMAM LG。在无共享的工作站机群上进行性能测试,证明PMAM算法是有效的。  相似文献   

15.
关联规则的开采与更新   总被引:26,自引:0,他引:26  
周海岩 《软件学报》1999,10(10):1078-1084
对关联规则的增量式更新算法——IUA(incremental updating algorithm)进行了分析,指出其存在的问题,并给出一个改进的算法NEWIUA(new IUA).NEWIUA算法对已存在的和本次更新时新产生的频繁项目集都加以充分的利用,因此,在保证算法有效的同时提高了效率.文章提出了3种关联规则开采的并行算法,并对各算法进行了分析和讨论.  相似文献   

16.
对关联规则的增量式更新算法--IUA(incremental updating algorithm)进行了分析,指出其存在的问题,并给出一个改进的算法NEWIUA(new IUA).NEWIUA算法对已存在的和本次更新时新产生的频繁项目集都加以充分的利用,因此,在保证算法有效的同时提高了效率.文章提出了3种关联规则开采的并行算法,并对各算法进行了分析和讨论.  相似文献   

17.
Mining class association rules (CARs) is an essential, but time-intensive task in Associative Classification (AC). A number of algorithms have been proposed to speed up the mining process. However, sequential algorithms are not efficient for mining CARs in large datasets while existing parallel algorithms require communication and collaboration among computing nodes which introduces the high cost of synchronization. This paper addresses these drawbacks by proposing three efficient approaches for mining CARs in large datasets relying on parallel computing. To date, this is the first study which tries to implement an algorithm for parallel mining CARs on a computer with the multi-core processor architecture. The proposed parallel algorithm is theoretically proven to be faster than existing parallel algorithms. The experimental results also show that our proposed parallel algorithm outperforms a recent sequential algorithm in mining time.  相似文献   

18.
在研究多段支持度数据挖掘算法的基础上提出并行挖掘相联规则的算法。给出了在并行条件下以负载平衡为目的的种子项集的划分的贪心算法策略。基于多段支持度特征,为减少各个处理机之间的制约,提出按事务长度进行数据集划分的方案,并具体实现了多段支持度的并行算法。实验结果表明该算法具有很高的效率,特别是在双CPU情况下,并行算法的效率接近顺序算法的两倍,如果把算法修正和推广到群集环境下,会更一步增加相联规则的实用性。  相似文献   

19.
Shared-nothing并行事务数据库系统中规则的挖掘与更新算法   总被引:1,自引:0,他引:1  
关联规则是数据挖掘中的一个重要研究内容.本文提出了Shared—nothing并行事务数据库系统(简称SNPDBS)中一种快速的关联规则挖掘算法SNPMAR,并考虑当最小支持度发生变化后SNPDBS中关联规则的高效更新问题,提出了一种有效的关联规则更新算法SNPIUA.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号