首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 265 毫秒
1.
分布式环境下挖掘约束性关联规则的算法研究   总被引:2,自引:0,他引:2  
关联规则是数据挖掘的重要研究内容。基于约束的关联规则挖掘可以促进交互式探查与分析。该文主要研究了分布式环境中挖掘约束性关联规则的问题。在并行关联规则挖掘算法CD和约束性关联规则挖掘算法Direct的基础上,提出了一种新的分布式挖掘约束性关联规则算法DMA_IC。该算法对于解决分布式挖掘约束性关联规则的问题是十分有效的。同时,文章还对DMA_IC算法的通信性能进行了讨论。  相似文献   

2.
由于分布环境的日益普遍并且需要结合使用者的实际要求对数据集按层次挖掘关联规则,故本文针对在分布式环境下基于项约束的关联规则挖掘和多层关联规则挖掘的特点,将交易表按概念层次进行编码。使用逐层迭代挖掘蓑略,结合CD算法和Direct算法提出一种在分布式环境下挖掘约束性多层关联规则的有效算法:MLACD算法。并通过实验验证该算法是正确有效的。  相似文献   

3.
分布式环境下约束性关联规则的快速挖掘   总被引:2,自引:0,他引:2  
研究人员针对单机环境提出了约束性关联规则的挖掘算法,但它们不适用于分布式环境.为此本文讨论分布式环境下约束性关联规则的快速挖掘技术,提出一种基于分布式环境的约束性关联规则快速挖掘算法DCAR,其中包括局部约束性频繁项目集挖掘算法MLFC和全局约束性频繁项目集挖掘算法MGFC.该算法根据布尔约束条件产生向导集,采用一种新的候选项集生成函数Reorder-gen,该函数通过向导集高效地产生分布式环境中满足约束条件的、数量较少且完备的候选项集,并且求解全局约束性频繁项集过程中,传送局部候选项集支持数的通信量为O(n),从而提高了算法的挖掘效率.将本文提出的算法加以实现,实验结果表明DCAR算法高效可行,其效率大约是DMA-IC算法的2-3倍.  相似文献   

4.
基于抽样的分布式约束性关联规则挖掘算法研究   总被引:1,自引:0,他引:1  
本文采用抽样的方法,在基于约束的Eclat类算法(例如Eclat A和Eclat M)的基础上,提出了一种分布式约束性关联规则的挖掘算法——DMCASE算法。本算法在各数据站点上对一个较小的样本采用基于约束的Eclat类算法,挖掘局部约束频繁项集,采用归纳学习的方法归并所有局部约束频繁项集,产生全局约束频繁项集。只需1次扫描数据库,挖掘效率较高。实验证明:该算法是一种十分有效的解决基于约束条件下的分布式关联规则挖掘算法。  相似文献   

5.
分布式系统中关联规则挖掘研究   总被引:5,自引:0,他引:5  
在分布式系统中如何挖掘关联规则是数据挖掘领域研究的一个重要课题。本文对关联规则分布式挖掘问题进行探讨,给出了关联规则分布式挖掘系统DAMINER的体系结构,提出了一种基于DAMINER的关联规则分布式挖掘算法ARDM。该算法具有通信代价小和时间开销少等优点。  相似文献   

6.
一种快速挖掘约束性关联规则的算法   总被引:2,自引:0,他引:2  
方刚 《计算机应用与软件》2009,26(8):268-270,280
提出一种快速挖掘约束性关联规则的算法,其适用于挖掘带约束条件的频繁项目集.该算法通过数字区间的数值自动递减产生候选频繁项,并用二进制的逻辑操作计算支持数和用数字特征减少扫描事务的个数.算法的原理简单有效,能够有效减少扫描的时间和产生候选频繁项的时间,与现有的约束性关联规则挖掘算法和基于二进制的挖掘算法相比,其效率得到明显提高.  相似文献   

7.
介绍了关联规则挖掘的基本原理和方法,详细分析了分布式关联规则挖掘算法并给出其模型;提出一种充分考虑数据源异构性、基于相似度的的分布式数据挖掘方法.实验证明该模型提高了挖掘的准确率.  相似文献   

8.
关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避免全局FP-tree可能过大而内存无法容纳的问题,算法在各个主要步骤上都实现了并行处理。算法测试结果和分析表明,与传统的关联规则挖掘算法FP-Growth相比,该算法通过多节点分布式并行处理显著提高了执行效率和处理能力。  相似文献   

9.
关联规则挖掘是近年来数据挖掘研究中一个非常活跃的领域,给出了关联规则及相关术语的定义,对关联规则挖掘中的频繁模式、频繁闭模式及并行/分布式挖掘作了阐述,着重介绍了近几年来发表的一些新算法,并对未来的发展趋势进行了预测和展望。  相似文献   

10.
关联规则挖掘是最常用、最重要的数据挖掘任务之一,经典的关联规则挖掘算法有Apriori、FP-Growth、Eclat等。随着数据的爆炸式增长,传统的算法已不能适应大数据挖掘的需要,需要分布式、并行的关联规则挖掘算法来解决上述问题。MapReduce是一种流行的分布式并行计算模型,因其使用简单、伸缩性好、自动负载均衡和自动容错等优点,得到了广泛的应用。本文对已有的基于MapReduce计算模型的并行关联规则挖掘算法进行了分类和综述,对其各自的优缺点和适用范围进行了总结,并对下一步的研究进行了展望。  相似文献   

11.
宫雨 《计算机工程与设计》2007,28(24):5838-5840
约束关联规则是关联规则研究中的重要问题,目前的研究大多集中在单变量约束,对双变量约束的研究较少,而双变量约束在实际中也有重要作用.针对这种情况,提出了双变量约束中具有下界约束的关联规则问题.在此基础上,给出了下界约束的定义,然后分析了满足下界约束频繁集的性质,并给出了相关的证明.最后提出了基于FP-Tree的下界约束算法,采用了预先测试的方法,降低了需要测试项集的数量和计算成本.实验结果表明,该算法具有较高的效率.  相似文献   

12.
项约束频繁项集挖掘的新方法   总被引:1,自引:0,他引:1       下载免费PDF全文
项约束频繁项集挖掘是项约束关联规则挖掘的关键步骤。对项约束频繁项集挖掘的内涵进行讨论,认为一个项集X本身满足项约束条件B是不够的,数据库中支持X的全部事务均满足B才能称“项集X满足条件B”。据此,将Direct算法改进为Direct*,在Direct*中负项被作为一个独立的项来看待。项约束是简洁性约束,但目前已有的算法没有充分利用其简洁性,提出利用项约束简洁性的MSEB算法。实验表明:对稠密数据库,MSEB的效率较高,并且Direct*和MSEB两个算法均是正确的。  相似文献   

13.
挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一.在对关联规则挖 掘中基于Apriori算法的改进算法进行深入分析和研究后,本文根据Apriori算法的不足,提出了一种改进策略,从而得到一种优化的Apriori算法.最后,对频繁项集挖掘算法的发展方向进行了初步的探讨.  相似文献   

14.
一种基于矩阵的多值关联规则的挖掘算法   总被引:2,自引:0,他引:2       下载免费PDF全文
关联规则是数据挖掘研究的主要模式之一,其中布尔型关联规则的挖掘已经有比较成熟的系统和方法,而多值关联规则的挖掘则不然。本文提出的QARMM算法利用矩阵存储数据,将频繁项目集的产生过程转化为项目集的关系矩阵中向量的运算过程,同时克服了SLIG算法和矩阵算法不能挖掘多值关联规则的弱点,只需运行一次便可挖掘出所有关联规则。实验证明,在等价的数据集上挖掘关联规则,QARMM算法比Apriori算法具有更高的效率。  相似文献   

15.
杨泽民 《计算机科学》2013,40(3):259-262
为了解决关联规则挖掘算法中频繁集信息挖掘不完善和时序周期对事务集频繁项挖掘的影响问题,提出了一种基于时序和兴趣度约束的加权关系规则挖掘算法。该算法首先利用时序滑动函数对时序事务集进行发生概率估算和权值赋值,依据兴趣度约束函数和剪枝定理进行事务集化简,然后根据支持度和寿支持期望进行加权频繁事务集抽取,最后依据置信度进行加权关联规则导出。实验结果证明,该算法能够快速有效地挖掘出符合用户兴趣度的关联规则。  相似文献   

16.
数据挖掘是从数据库中发现潜在有用知识或者感兴趣模式的过程。在数据挖掘领域中主要集中于单一支持度下的关联规则挖掘,在事务数据库中发现项目之间的关联性,而在实际应用中,项目可以有不同的最小支持度,不同的项目可能具有不同的标准去判断其重要性,因此提出一个在最大值支持度约束下,发现有用的模糊关联规则挖掘算法,在该约束下,利用逐层搜索的迭代方法发现频繁项目集,通过实例证明了该挖掘算法是易于理解和有意义的,具有很好的效率。  相似文献   

17.
基于基集与概念格的关联规则挖掘算法   总被引:2,自引:0,他引:2       下载免费PDF全文
陈湘  吴跃 《计算机工程》2010,36(19):34-36
传统关联规则挖掘算法的挖掘效率较低,且挖掘结果中存在大量冗余。针对该问题,提出一种基于概念格与基集的关联规则挖掘算法。利用规定种子项分布范围的基集代替原始数据库以缩小挖掘源规模,从而建立概念格快速求解出关联规则。实验结果表明,该算法在时间效率方面优于Base和Apriori算法。  相似文献   

18.
一种快速有效的分布式开采多层关联规则的算法   总被引:6,自引:0,他引:6  
关联规则(association rules)是数据开采的重要研究内容,建立项目的层次关系可以发现更加有意义的规则,主要研究分布式环境下开采多层关联规则的问题,提出了一种快速有效的MLFDM算法,采用的技术包括分布式编码交易表的有效修剪,侯选集的产生及修剪技术,侯选项集的全局支持数的计算方法等,论述了它的原理,具体实现方法及其几个改进算法,实验结果表明,算法MLFDM是有效的,并对MLFDM算法的几个变种进行了讨论。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号