首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
张伟  郑涛  李辉 《计算机工程》2004,30(22):84-85,100
提出一种通过分组达到并行化的改进Apriori算法,研究了分组的构造以及分组后因连接步和剪枝步的简化而达到的效率的提高。对于算法中涉及的原理给予了完整的论证并结合实例给出了改进算法的实现步骤。结果表明,改进算法通过连接步和修剪步的简化大大地提高了规则发现的效率,并可以很方便地达到并行化。  相似文献   

2.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。  相似文献   

3.
发现关联规则是数据挖掘的一个重要的任务.简要介绍了几种发现关联规则的串行算法和并行算法,并针对IDD和HD这两种效率和可扩展性较好的算法,引入在线LPT调度算法,有效地解决了IDD和HD算法中非常重要的候选项目集在各个处理器节点之间的划分问题,尽可能使得各个节点负载平衡,从而提高算法的效率.  相似文献   

4.
快速关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
高俊  施伯乐 《计算机科学》2005,32(3):200-201
本文在分析FP-growth关联规则挖掘算法的基础上,提出了一种称之为MFP的算法,给出了算法的工作原理。MFP算法能在一次扫描事务数据库过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。  相似文献   

5.
提出了一种从大型数据库中挖掘关联规则的快速算法。该算法以经典的Apriori算法为基础,在分析研究已有各种优化算法的基础上,提出了自适应步长和扫描树的概念,并采用修剪的方法对Apriori算法进行了改进。理论证明,它比Apriori算法的应用效率高,实验结果也证实了它的有效性。  相似文献   

6.
文章主要论述了数据挖掘的概念、过程及应用前景,此外还重点介绍了数据挖掘中常用的一种算法-关联规则算法.  相似文献   

7.
一种基于决策树的快速关联规则挖掘算法   总被引:2,自引:0,他引:2  
陈雪飞 《计算机科学》2008,35(7):252-254
本文对关联规则的挖掘问题进行了深入研究.在总结现有算法优缺点的基础上,提出了一种新的基于决策树的快速关联规则挖掘算法(RABDT),结合决策树的构造过程,给出了算法的原理和实现步骤,并通过实验对比验证了算法的有效性.  相似文献   

8.
一种新的广义关联规则挖掘算法   总被引:2,自引:0,他引:2  
通过对广义关联规则挖掘中的数据源的分析研究.采用分层抽样的数学方法筛选数据源.提出了一种效率更高的挖掘广义关联规则的新算法即分层抽样算法(Stratify Sample)SS,并进行了理论证明和分析.  相似文献   

9.
并行的关联规则增量式更新优化算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
针对关联规则快速更新算法(PFUP)会带来单处理机运行负荷过重、降低执行效率的问题,提出基于并行计算快速更新算法(PPFUP)。在无共享的工作站上,通过划分局部频繁项集并分配到结点,采用并行思想处理原数据库和新增数据库的计算任务,降低单处理机内存压力。实验证明了该算法的有效性。  相似文献   

10.
分析了并行关联规则挖掘算法存在的不足,提出了一种改进的关联规则挖掘的多核并行优化算法。该算法对Apriori算法的压缩矩阵进行了改造,并在多核平台下利用OpenMP技术和TBB技术对串行程序进行循环并行化和任务分配的并行化设计,最大限度地实现并行关联规则挖掘。  相似文献   

11.
挖掘关联规则的并行算法   总被引:3,自引:0,他引:3  
从大型数据库中挖掘关联规则是数据挖掘中一个重要的课题 .从挖掘要求的时间和空间上看 ,传统的顺序算法已很难适应于现实中不断增大的数据库规模 .而研究和发展高性能、可扩展的并行算法对解决这一问题就显得十分必要 .本文介绍了挖掘关联规则一些主要的并行算法 ,并对它们进行了一定分析 ,指出了发展并行算法要考虑的一些问题 .  相似文献   

12.
在研究多段支持度数据挖掘算法的基础上提出并行挖掘相联规则的算法。给出了在并行条件下以负载平衡为目的的种子项集的划分的贪心算法策略。基于多段支持度特征,为减少各个处理机之间的制约,提出按事务长度进行数据集划分的方案,并具体实现了多段支持度的并行算法。实验结果表明该算法具有很高的效率,特别是在双CPU情况下,并行算法的效率接近顺序算法的两倍,如果把算法修正和推广到群集环境下,会更一步增加相联规则的实用性。  相似文献   

13.
关联规则的快速提取算法   总被引:1,自引:0,他引:1  
针对基于频繁项集的关联规则挖掘算法效率低,需要多次扫描数据库且生成冗余候选项集问题,该文利用频繁项集的Aprior性质和概念格的基本思想提出一种关联规则提取算法,利用极大频繁项集来进行规则提取,去除了多数冗余的候选项集,提高了提取效率。  相似文献   

14.
一种改进的挖掘关联规则的并行算法研究   总被引:2,自引:0,他引:2  
介绍了一种改进的基于Apriori算法的挖掘关联规则的并行算法,并和以前提出的DD算法了比较。这种改进的算法IDD克服了以前提出的DD逄法的缺点,消除了DD算法中的工作冗余。  相似文献   

15.
聚类后的关联规则快速更新算法研究   总被引:1,自引:0,他引:1  
关联规则和聚类分析是数据挖掘中重要的研究课题。通过对关联规则挖掘算法Apriori算法进行分析与研究,指出了其在实用中存在的两个主要问题。鉴于此,在分析聚类分析和关联规则两种挖掘算法的基础上,讨论了将这两种独立的挖掘方法集成起来的联合挖掘,使其可以有效地压缩数据规模。给出了聚类后的关联规则快速更新算法描述。实验结果表明,算法性能优良,提高了数据挖掘执行效率。  相似文献   

16.
关联规则挖掘是数据挖掘的一个重要分支,但随着数据的快速增长,传统关联规则挖掘算法不能很好地适应大数据的要求,需要在分布式、并行计算的平台上寻找突破。Spark是专门为大数据处理而设计的一个适合迭代运算的并行计算模型,相比MapReduce具有更高效、充分利用内存、更适合迭代计算和交互式处理的优点。对已有的基于Spark的并行关联规则挖掘算法进行了分类和综述,并总结了各自的优缺点和适用范围,为下一步的研究提供参考。  相似文献   

17.
快速关联规则挖掘算法   总被引:13,自引:2,他引:13  
关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集。Apriori及其改良算法是频繁项集挖掘的有效算法。在类Apriori的算法中,它们都采用哈希树来存储频繁项集的候补项集以便快速计算其支持度。该文在仔细分析这些算法所存在的效率瓶颈的基础上,提出了另一个有效的改进算法。所提算法通过利用一个一维数组替代已有算法中的复杂的哈希树来达到改善它们效率瓶颈的目的。通过多个实验评估,该文所提算法的挖掘效率很高,比Apriori及其改良算法要快2到5倍。  相似文献   

18.
关联规则的并行挖掘算法研究   总被引:1,自引:0,他引:1  
给出了并行挖掘关联规则的形式化描述和并行挖掘的模型.在研究基于Aprior算法的各种并行实现如CD、DD、IDD和HD算法后,针对这些算法扩展性差以及负载不平衡的缺点,提出了在IDD和HD算法上使用Sidle调度策略,有效地解决了IDD和HD算法中非常重要的候选项目集在各个处理器节点之间的划分问题,尽可能使得各个节点负载平衡,从而提高算法的效率.  相似文献   

19.
陈涛  张玮 《微机发展》2007,17(1):139-141
在研究关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,并给出了并行数据挖掘的计算框架。提出了一个以计算服务器为中心节点的并行挖掘算法,可以发挥各局部节点的优势,无需各局部节点进行通信,减少了各局部节点的通信负荷。通过理论分析和实验数据验证,该算法具有较好的可扩展性和海量处理能力,特别是在节点数目较多的情况下更显示出优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号