首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
加权关联规则的并行挖掘算法   总被引:4,自引:1,他引:4  
关联规则是数据挖掘的重要研究内容之一,而传统的算法均为串行算法且将数据库项目按平等一致方式加以处理。文章提出了加权关联规则的并行挖掘算法,探讨了相关的数据结构,并对算法进行了定性分析。  相似文献   

2.
关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避免全局FP-tree可能过大而内存无法容纳的问题,算法在各个主要步骤上都实现了并行处理。算法测试结果和分析表明,与传统的关联规则挖掘算法FP-Growth相比,该算法通过多节点分布式并行处理显著提高了执行效率和处理能力。  相似文献   

3.
吴磊  陈鹏 《计算机应用》2005,25(9):1989-1991
研究了采用并行算法挖掘关联规则的优化方案。在数据分发(DD)算法的基础上引入了改进的智能数据分发(IDD)算法;之后提出采用混和分发(HD)算法,该算法综合了计数分发(CD)和IDD算法的优点,简单而有效地解决了算法中非常重要的候选项目集在各个处理器节点之间的划分问题,尽可能使得各个节点负载平衡。最后,对IDD和HD算法的复杂度给出了较为详细的分析。  相似文献   

4.
多表间关联规则的并行挖掘算法   总被引:5,自引:0,他引:5  
通过关键字符相关属性之间的联系,在不进行连接操作的情况下,探讨了多表间关联规则的数据挖掘问题。给出了相关的数据结构和具体有较好并行度的算法,并对算法作了定性分析。  相似文献   

5.
并行关联规则挖掘综述   总被引:3,自引:0,他引:3  
关联规则发现作为数据挖掘的重要研究内容,在许多实际领域内得到了广泛的应用。因为在挖掘过程中涉及到大量的数据和计算,高性能计算成为大规模数据挖掘应用的一个重要组成部分。该文介绍了当前并行关联规则挖掘方面的研究进展,对一些典型算法进行了分析和评价,从并行度、负载平衡以及和数据库的集成等方面展望了并行关联规则挖掘的研究方向。  相似文献   

6.
数据库中关联规则的并行挖掘算法   总被引:2,自引:1,他引:1  
提出了数据库中挖掘关联规则的并行算法,探讨了相关的数据结构,并对算法进行了定性分析。该算法不仅适用于布尔型属性,而且也适用于非布尔型属性。  相似文献   

7.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。  相似文献   

8.
并行多层关联规则的挖掘算法研究   总被引:1,自引:0,他引:1  
王华秋  王越  曹长修 《计算机应用》2006,26(2):373-0375
在分析了单数据库多层关联规则算法SMAM算法的基础上,为了提高现有算法的效率,改善内存的使用率,提出了两种并行多层关联规则算法PMAM L和PMAM LG。在无共享的工作站机群上进行性能测试,证明PMAM算法是有效的。  相似文献   

9.
针对顺序的模糊关联规则算法在处理海量飞行数据时,由于算法可扩展性低、响应时间过长而带来数据处理的不便,本文采用模糊关联并行挖掘算法,先使用并行的模糊c-2均值算法将数量型属性划分成若干个模糊集,并借助模糊集软化属性的划分边界:在用改进的布尔型关联规则的并行挖掘算法来发现频繁模糊属性集.通过飞行数据库进行算法验证,证明了并行算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

10.
发现关联规则是数据挖掘的一个重要的任务.简要介绍了几种发现关联规则的串行算法和并行算法,并针对IDD和HD这两种效率和可扩展性较好的算法,引入在线LPT调度算法,有效地解决了IDD和HD算法中非常重要的候选项目集在各个处理器节点之间的划分问题,尽可能使得各个节点负载平衡,从而提高算法的效率.  相似文献   

11.
讨论了并行关联规则算法在地震预报中的应用,提出了分区、画圆数据预处理方法和相应的并行关联规则算法,给出实验结果并进行了解释分析。  相似文献   

12.
关联规则挖掘是最常用、最重要的数据挖掘任务之一,经典的关联规则挖掘算法有Apriori、FP-Growth、Eclat等。随着数据的爆炸式增长,传统的算法已不能适应大数据挖掘的需要,需要分布式、并行的关联规则挖掘算法来解决上述问题。MapReduce是一种流行的分布式并行计算模型,因其使用简单、伸缩性好、自动负载均衡和自动容错等优点,得到了广泛的应用。本文对已有的基于MapReduce计算模型的并行关联规则挖掘算法进行了分类和综述,对其各自的优缺点和适用范围进行了总结,并对下一步的研究进行了展望。  相似文献   

13.
本文根据关联规则和分类规则的概念与表示形式,指出在关联规则挖掘过程中如果指定挖掘与一个确定的项相关联,那么就是分类规则挖掘了,论述了分类规则是特殊情况下的关联规则,并指出在这种特殊情况下,关联规则所具有的特征;然后根据这一论述,提出了一种在关联规则挖掘算法中利用限制条件概率分布来发现分类规则的算法。  相似文献   

14.
一个高效剪枝的新关联规则挖掘算法   总被引:4,自引:0,他引:4  
分析了现有的对Apriori算法的改进方向,新算法将Apriori的剪枝步骤合并入从Lk-1与Lk-1连接生成Ck的连接步骤,通过使用临时项集TQ存储Lk-1中单个数据项集与Lk-1中其他数据项集连接的结果,从而将被扫描集合的大小从Lk-1缩减为L1的大小,极大地提高了Ck的生成效率。  相似文献   

15.
介绍了关联规则挖掘的相关概念和挖掘步骤,提出了一种改进的挖掘算法,并采用C++语言对算法进行了具体实现。  相似文献   

16.
This paper proposes a method to encode database. By this way, a record is denoted by only one binary number, so the size of the database is reduced sharply. If some known modified algorithms are used on the database encoded, the efficiency will be improved significantly. At the meantime, a new algorithm based on the proposed encoding method is introduced too. By using some properties of numbers, the itemsets of the database can be converted into numerical fields. Different from the Apriori, the new algorithm discovers the association rules from the largest frequent itemset at first, and then all subitemsets, which are also frequent, will be gotten without any calculation, and all the other small none-frequent itemsets that must be generated in the Apriori will be omitted, and the scan times of the database are also reduced. Test results show the new algorithm based on the encoding database has a lower complexity of time and space.  相似文献   

17.
一种基于关联规则挖掘的粗糙集约简算法   总被引:6,自引:1,他引:6  
针对粗糙集理论中的约简这个重要问题进行了研究,引入关联规则挖掘中的支持度和置信度概念,提出一种基于关联规则挖掘算法思想的约简算法,从而得到更有效的约简。  相似文献   

18.
针对FP算法的缺陷,将OLAP技术和Apriori关联规则相结合,提出一种针对FP算法的改进的多层次关联规则数据挖掘算法,在分析关联规则数据挖掘结构的基础上,给出该算法的思想与执行步骤,对于关联规则数据挖掘的研究具有一定的理论意义.  相似文献   

19.
针对量化关联规则的特点,提出基于多目标烟花算法和反向学习的量化关联规则挖掘算法.该算法通过多目标烟花算法全面搜索关联规则,引入反向学习提高算法收敛速度并降低算法陷入局部最优的概率,使用基于相似度的冗余淘汰机制保持库中关联规则的多样性,经过多次迭代最终获得关联规则集合.文中算法无需人为指定支持度、置信度等阈值,实验表明,算法在不同数据集上均获得稳定结果,能充分覆盖数据集,在可靠性、相关性及可理解性之间获得较好的均衡.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号