首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
挖掘关联规则的并行算法研究   总被引:5,自引:2,他引:5  
对挖掘关联规则的算法进行了简单的回顾,分析了已有的挖掘关联规则算法的不足,介绍了几种挖掘关联规则的关行算法。  相似文献   

2.
一种改进的挖掘关联规则的并行算法研究   总被引:2,自引:0,他引:2  
介绍了一种改进的基于Apriori算法的挖掘关联规则的并行算法,并和以前提出的DD算法了比较。这种改进的算法IDD克服了以前提出的DD逄法的缺点,消除了DD算法中的工作冗余。  相似文献   

3.
并行关联规则挖掘综述   总被引:3,自引:0,他引:3  
关联规则发现作为数据挖掘的重要研究内容,在许多实际领域内得到了广泛的应用。因为在挖掘过程中涉及到大量的数据和计算,高性能计算成为大规模数据挖掘应用的一个重要组成部分。该文介绍了当前并行关联规则挖掘方面的研究进展,对一些典型算法进行了分析和评价,从并行度、负载平衡以及和数据库的集成等方面展望了并行关联规则挖掘的研究方向。  相似文献   

4.
多表间关联规则的并行挖掘算法   总被引:5,自引:0,他引:5  
通过关键字符相关属性之间的联系,在不进行连接操作的情况下,探讨了多表间关联规则的数据挖掘问题。给出了相关的数据结构和具体有较好并行度的算法,并对算法作了定性分析。  相似文献   

5.
加权关联规则的并行挖掘算法   总被引:4,自引:1,他引:4  
关联规则是数据挖掘的重要研究内容之一,而传统的算法均为串行算法且将数据库项目按平等一致方式加以处理。文章提出了加权关联规则的并行挖掘算法,探讨了相关的数据结构,并对算法进行了定性分析。  相似文献   

6.
关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避免全局FP-tree可能过大而内存无法容纳的问题,算法在各个主要步骤上都实现了并行处理。算法测试结果和分析表明,与传统的关联规则挖掘算法FP-Growth相比,该算法通过多节点分布式并行处理显著提高了执行效率和处理能力。  相似文献   

7.
采掘关联规则的高效并行算法   总被引:32,自引:1,他引:32  
采掘关联规则是数据采掘领域的一个重要问题。文中对采掘关联规则问题进行了简单的回顾,给出了一种提高顺序采掘关联规则效率的方法;分析了已有并采掘关联规则算法的优缺点;设计了一个效率较高的并行采掘关联规则的算法PMAR;并与其它相应算法进行了比较,实验证明,算法PMAR是有效的。  相似文献   

8.
数据库中关联规则的并行挖掘算法   总被引:2,自引:1,他引:1  
提出了数据库中挖掘关联规则的并行算法,探讨了相关的数据结构,并对算法进行了定性分析。该算法不仅适用于布尔型属性,而且也适用于非布尔型属性。  相似文献   

9.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。  相似文献   

10.
关联规则挖掘是数据挖掘的知识模式中比较重要的一项任务,它的目的是发现数据集中所有的频繁模式。根据关联规则定义及属性,可发现关联规则。利用Apriori算法实现了关联规则的挖掘,关联规则可以产生清晰有用的结果;可以广泛应用于各个领域,既可以检验行业内长期形成的知识模式,也能够发现隐藏的新规律,是完成数据挖掘任务的一个重要手段。  相似文献   

11.
陈涛  张玮 《微机发展》2007,17(1):139-141
在研究关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,并给出了并行数据挖掘的计算框架。提出了一个以计算服务器为中心节点的并行挖掘算法,可以发挥各局部节点的优势,无需各局部节点进行通信,减少了各局部节点的通信负荷。通过理论分析和实验数据验证,该算法具有较好的可扩展性和海量处理能力,特别是在节点数目较多的情况下更显示出优势。  相似文献   

12.
Mining association rules from large databases is very costly. We propose to develop parallel algorithms for this task on shared-memory multiprocessor (SMP). All proposed parallel algorithms for other paradigms follow the conventional level-wise approach: they need as many iterations as the length of the maximum large itemset. To make matter worse, they impose a synchronization in every iteration which would cause serious I/O contention on shared-memory parallel system. An adaptive asynchronous parallel mining algorithm APM has been proposed for SMP. All processors generate candidates dynamically and count itemset supports independently without synchronization. Two optimization techniques have been proposed for the reduction of database scanning and the number of candidates. The algorithm APM has been implemented on a Sun Enterprise 4000 shared-memory multiprocessor with 12 nodes. The experiments show that the optimizations have very good effects and APM has a substantial lead in performance over other proposed level-wise algorithms.  相似文献   

13.
发现关联规则是数据挖掘的一个重要的任务.简要介绍了几种发现关联规则的串行算法和并行算法,并针对IDD和HD这两种效率和可扩展性较好的算法,引入在线LPT调度算法,有效地解决了IDD和HD算法中非常重要的候选项目集在各个处理器节点之间的划分问题,尽可能使得各个节点负载平衡,从而提高算法的效率.  相似文献   

14.
基于关联图的关联规则挖掘算法研究   总被引:15,自引:0,他引:15  
在挖掘关联规则的过程中 ,一个关键的步骤是产生频繁项目集 .本文给出一种基于关联图的关联规则挖掘算法 ,并将它与性能比较好的关联规则挖掘算法 DHP进行了比较 ,结果表明 ,本文的算法优于 DHP算法  相似文献   

15.
对关联规则算法进行了研究和分析,基于候选集的Apriori-like算法需要反复扫描数据库,并产生大量的候选集,在挖掘低支持度、长模式的规则时效率低下。针对算法的缺陷,该文提出了一种PS算法,优化了关联规则的挖掘。实验结果证明了该算法的有效性。  相似文献   

16.
关联规则开采的集合算法   总被引:1,自引:0,他引:1  
为了有效地从商业数据库中开采出有用的信息,需要解决的两个关键问题:(1)如何将现有的各种开采算法集成到DBMS(数据库管理系统)中去,(2)提高开采的效率,本文以关联规则开采为例,研究了上述问题,为了将关联规则开采算法与DBMS进行无缝集成,我们需要研制面向集合操作的集合算法,STEM是关联规则开采的经共集合算法,我们在分析了STEM算法性能以后提出了改进的SETM算法,为了提高开采的效率我们给出了并行开采算法PSETM*(Parallel SETM*),从算法比较中可以看出SETM*比SETM要高效。  相似文献   

17.
随着大型数据库系统在各行业普及,数据库中存储的数据量急剧增大,数据挖掘是从海量数据中挖掘有效或重要信息的过程。关联规则挖掘作为数据挖掘的重要研究课题,被广泛地应用。伴随挖掘数据库的规模不断发生变化,对数据的需求也会有所不同,如何从扩展数据库中高效地对已经推导出的关联规则进行更新具有非常重要的应用价值,这就是所谓的增量式挖掘关联规则的问题。  相似文献   

18.
关联规则提取中对Apriori算法的一种改进   总被引:25,自引:0,他引:25  
关联规则的提取是数据挖掘中的重要研究课题,该文对关联规则提取中的Apriori算法进行了深入研究,指出了该算法的某些不足,提出了一种改进算法。实验结果表明,该算法性能明显优于Apriori算法,具有较高的推广价值。  相似文献   

19.
基于分布数据库的快速关联规则挖掘算法   总被引:8,自引:0,他引:8  
关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些”或”、”与”、”异或”等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。  相似文献   

20.
时态关联规则挖掘是针对在一段时间范围内的关联挖掘,在现实中有较多的应用。现有的大多数时态关联挖掘算法或者需要多次扫描数据库,或者没有考虑各个项在数据集上出现或结束时间上的不同,因而挖掘性能受到较大的制约。为此,本文提出一种增量式的面向具有不同时间出现与结束的项的时态关联规则挖掘算法。为减少存储方面的开销,只需保存已挖掘过的历史数据集中的频繁1项集。为了减少数据的扫描量,通过有效的剪枝策略,有选择性地扫描相关事务项,至多只需扫描一次完整的数据库。实验证明,该算法具有较好的挖掘性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号