首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
一种改进的挖掘关联规则的并行算法研究   总被引:2,自引:0,他引:2  
介绍了一种改进的基于Apriori算法的挖掘关联规则的并行算法,并和以前提出的DD算法了比较。这种改进的算法IDD克服了以前提出的DD逄法的缺点,消除了DD算法中的工作冗余。  相似文献   

2.
挖掘关联规则的并行算法   总被引:3,自引:0,他引:3  
从大型数据库中挖掘关联规则是数据挖掘中一个重要的课题 .从挖掘要求的时间和空间上看 ,传统的顺序算法已很难适应于现实中不断增大的数据库规模 .而研究和发展高性能、可扩展的并行算法对解决这一问题就显得十分必要 .本文介绍了挖掘关联规则一些主要的并行算法 ,并对它们进行了一定分析 ,指出了发展并行算法要考虑的一些问题 .  相似文献   

3.
多表间关联规则的并行挖掘算法   总被引:5,自引:0,他引:5  
通过关键字符相关属性之间的联系,在不进行连接操作的情况下,探讨了多表间关联规则的数据挖掘问题。给出了相关的数据结构和具体有较好并行度的算法,并对算法作了定性分析。  相似文献   

4.
并行关联规则挖掘综述   总被引:3,自引:0,他引:3  
关联规则发现作为数据挖掘的重要研究内容,在许多实际领域内得到了广泛的应用。因为在挖掘过程中涉及到大量的数据和计算,高性能计算成为大规模数据挖掘应用的一个重要组成部分。该文介绍了当前并行关联规则挖掘方面的研究进展,对一些典型算法进行了分析和评价,从并行度、负载平衡以及和数据库的集成等方面展望了并行关联规则挖掘的研究方向。  相似文献   

5.
在研究多段支持度数据挖掘算法的基础上提出并行挖掘相联规则的算法。给出了在并行条件下以负载平衡为目的的种子项集的划分的贪心算法策略。基于多段支持度特征,为减少各个处理机之间的制约,提出按事务长度进行数据集划分的方案,并具体实现了多段支持度的并行算法。实验结果表明该算法具有很高的效率,特别是在双CPU情况下,并行算法的效率接近顺序算法的两倍,如果把算法修正和推广到群集环境下,会更一步增加相联规则的实用性。  相似文献   

6.
加权关联规则的并行挖掘算法   总被引:4,自引:1,他引:4  
关联规则是数据挖掘的重要研究内容之一,而传统的算法均为串行算法且将数据库项目按平等一致方式加以处理。文章提出了加权关联规则的并行挖掘算法,探讨了相关的数据结构,并对算法进行了定性分析。  相似文献   

7.
关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避免全局FP-tree可能过大而内存无法容纳的问题,算法在各个主要步骤上都实现了并行处理。算法测试结果和分析表明,与传统的关联规则挖掘算法FP-Growth相比,该算法通过多节点分布式并行处理显著提高了执行效率和处理能力。  相似文献   

8.
关联规则挖掘综述   总被引:62,自引:0,他引:62  
介绍了关联规则挖掘的研究情况,提出了关联规则的分类方法,对一些典型算法进行了分析和评价,指出传统关联规则衡量标准的不足,归纳出关联规则的价值衡量方法,展望了关联规则挖掘的未来研究方向。  相似文献   

9.
一种新的关联规则挖掘的模型   总被引:1,自引:0,他引:1  
1.引言 support-confidence模型是正关联规则挖掘普遍应用的模型,而如何度量关联规则的不确定性则是正关联规则挖掘中的重要问题之一。在该模型中,用supp(X∪Y)和conf(X→Y)来度量关联规则X→Y的不确定性。然而,用这一度量标准可能会得到诸如X→Y,但X与Y不相关(或独立)的规则。可见,用conf(X→Y)来度量关联规则是不够的. 实际应用中,我们不仅要挖掘正关联规则,而且还要挖掘负关联规则。正关联规则即形如X→Y的式子,负关联规则即形如X→Y的式子,其中X,YI,X∩Y=,I为数据库D中的所有项的集合,首先看一个例子,若p(c)=0.6,p(t)=0.4,p(t∪c)=0.05,p(t∪c)=0.35,minconf=0.52,有p(t∪c)/p(t)=0.05/0.4=0.125minconf。因此,t→c为一有效规则。  相似文献   

10.
1 引言数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。通常,经过某些数据挖掘工具的挖掘后,例如,文[1]所给出的快速算法,我们会得到大量的关联规则。对用户来说,从这些大量的规则中找出自己感兴趣的规则十分困难,而且,也  相似文献   

11.
关联规则的并行挖掘算法研究   总被引:1,自引:0,他引:1  
给出了并行挖掘关联规则的形式化描述和并行挖掘的模型.在研究基于Aprior算法的各种并行实现如CD、DD、IDD和HD算法后,针对这些算法扩展性差以及负载不平衡的缺点,提出了在IDD和HD算法上使用Sidle调度策略,有效地解决了IDD和HD算法中非常重要的候选项目集在各个处理器节点之间的划分问题,尽可能使得各个节点负载平衡,从而提高算法的效率.  相似文献   

12.
1 引言关联规则是指包含了一组对象间特定关联关系的规则。由于关联规则的挖掘有着广阔的应用背景,因此,人们对关联规则的挖掘算法作了大量的研究。从离散的布尔型变量、枚举型变量分析到连续的数值型变量分析;从平面的单事务项内部关系的分析到立体N维的多事务项之间关系的分析;从集中式的整体的静  相似文献   

13.
关联规则数据挖掘综述   总被引:2,自引:0,他引:2  
阐述了关联规则及其基本算法,归纳了关联规则数据挖掘的诸多研究方向,认为算法的效率、规则兴趣度和扩展的关联规则挖掘是研究的重点.  相似文献   

14.
数据挖掘是目前比较热门的一个研究领域,而关联规则的挖掘又是数据挖掘的一个重要课题。首先介绍关联规则的基本概念和它的挖掘过程,然后就几种典型的关联规则算法进行概括并对它们进行分析和性能的比较.对关联规则挖掘应用的现状进行总结。  相似文献   

15.
几种典型关联规则算法的分析与比较   总被引:1,自引:0,他引:1  
胡佳 《现代计算机》2011,(17):15-17
数据挖掘是目前比较热门的一个研究领域,而关联规则的挖掘又是数据挖掘的一个重要课题。首先介绍关联规则的基本概念和它的挖掘过程,然后就几种典型的关联规则算法进行概括并对它们进行分析和性能的比较,对关联规则挖掘应用的现状进行总结。  相似文献   

16.
关联规则挖掘最小支持度阀值设定的优化算法研究   总被引:2,自引:0,他引:2  
为了解决在关联规则挖掘Apriori算法中最小支持度阀值设定较难或设定不适当的问题,基于事务普遍具有统计规律性的前提,设计了平均值调整优化的算法.为支持度和预选率划分不同区间,利用平均值进行最小支持度阀值的微调.对于不同分布特征的事务数据库,该方法比原先设定阀值都能取得更适中和更好的频繁项集结果,同时不会产生过大的性能...  相似文献   

17.
为满足大数据实时处理的需求,提出了一种基于划分的关联规则并行分层挖掘算法(Parallel Hierarchical Association Rule Mining,PHARM)。首先,将整个数据库D随机分割成若干个非重叠区域,并行挖掘出局部频繁项集;然后利用先验性质,连接局部频繁项集得全局候选项集;再次扫描D统计出每个候选项集的实际支持度,以确定全局频繁项集。最后,建模分析了该算法的高效性。  相似文献   

18.
关联规则挖掘综述   总被引:8,自引:0,他引:8  
介绍了关联规则挖掘的一般概念 ,并进一步导出它的一般框架 ;同时对一些典型算法进行了分析和比较 ,介绍了关联规则的应用 ;最后展望了关联规则挖掘的未来研究方向。  相似文献   

19.
提出了一种新的面向主题的关联挖掘和联想算法,并提出了主题关联联想概念以及挖掘主题的间接关联关系。实验表明,该算法能有效地实现Web主题知识的自动获取和自学习。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号