首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
数据挖掘中常用关联规则挖掘算法   总被引:3,自引:3,他引:3  
文中首先介绍了数据挖掘中关联规则的经典算法--Apiori算法.再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论.然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP-growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法.最后对关联规则挖掘的发展远景进行了展望.  相似文献   

2.
文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP—growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法。最后对关联规则挖掘的发展远景进行了展望。  相似文献   

3.
一种高效的混合压缩数据挖掘算法*   总被引:1,自引:0,他引:1  
针对基于垂直数据格式的关联规则挖掘算法在频繁项集查找过程中,需要在内存中保存大量的事务标志列表,有限的内存容量将成为此类算法的最大瓶颈,提出了一种新的混合压缩算法—HC-DM算法。实验结果表明,将HC-DM算法与dEclat算法相结合,再加上排序步骤,可以显著减少频繁项集挖掘过程中的内存使用量。  相似文献   

4.
论述了频繁项集数据挖掘算法,并采用自底向上和自顶向下遍历搜索分类方法,对已有的频繁项集挖掘算法进行了分析和比较。  相似文献   

5.
将TCMA算法用于挖掘TCM-FP树中的最大频繁项集。在中药维度上应用了双支持度,既缩小了挖掘的范围又提高了规则的意义。算法挖掘的中药TCM规则切合实际,且比FP-growth挖掘算法有更高的运行效率。基于TCMA算法设计了中药挖掘器。将挖掘出的TCM规则作为知识库,可为中药的配方提供参考。  相似文献   

6.
随着数据库信息技术的快速发展,数据挖掘技术也得到了快速的发展和应用.数据挖掘技术是在海量的信息中找出有价值的信息的一种技术,在数据挖掘技术中关联规则算法是重要的研究对象.对数据挖掘技术研究现状进行了分析,对数据挖掘技术的特点及应用进行了研究,结合关联规则算法的具体应用特点,对基于关联规则算法的数据挖掘技术进行了分析与研究.  相似文献   

7.
基于频繁项集挖掘算法的改进与研究   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘领域中重要的研究内容,频繁项集挖掘又是关联规则挖掘中的关键问题之一。针对已有的频繁项集挖掘算法存在的问题,通过对Apriori算法的分析,提出了Inter-Apriori频繁项集挖掘算法。该算法使用交集策略减少扫描数据库的次数,从而使算法达到较高的效率。实验结果表明,Inter-Apriori算法是Apriori算法效率的2~4倍。  相似文献   

8.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

9.
数据挖掘中关联规则算法的研究   总被引:1,自引:0,他引:1       下载免费PDF全文
目前,人们已经提出了许多挖掘关联规则的算法及其变型,其中最著名的是Apriori算法,但传统的算法效率太低。为了解决这些问题,本文提出了一种快速更新的关联挖掘算法。  相似文献   

10.
多段支持度数据挖掘算法研究   总被引:17,自引:0,他引:17  
在基于相联规则的数据挖掘算法中,Apriori等算法最为著名。它分为两个主要步骤:(1)通过多趟扫描数据库求解出频繁项集;(2)利用频繁项集生成规则。随后的许多算法都沿用Apriori中“频繁项集的子集必为频繁项集”的思想,在频繁项集Lk-1上进行JOIN运算构成潜在k项集Ck。由于数据库和Ck的规模较大,需要相当大的计算量才能生成频繁项集。AprioriTid算法给每个事务增加了一个唯一标识Tid,其特点是只扫描一趟数据库,其余趟扫描(如第k趟扫描)均在相应的数据集Ck^-上进行。由于数据规模改变不大,各算法的效率差别并不明显。该文提出分段计算支持度的思想,是把一个项集的支持度分段计算,每一个段记录该项集在相应规模事务中出现的频度,从而构成一个支持度向量。由于有了项集的多段支持度,可以推测出该项集能否包含在更大规模的频率项集中,采用这种算法既提高了在扫描数据库中的信息获取度,又能及时剔除超集不是频繁项集的项集,进一步缩减了潜在项集的规模,在数据集扫描过程中,按文中定理1的思想调整数据集,达到提高频繁项集生成效率的目的。  相似文献   

11.
本文主要介绍了数据挖掘中的关联规则,关联规则中的经典算法Apriori算法.以及Apfiofi算法的改进研究。  相似文献   

12.
医学数据挖掘中的数据预处理与Apriori算法改进   总被引:2,自引:0,他引:2  
医学数据挖掘是提高医院信息管理水平,为疾病的诊断和治疗提供科学的、准确的决策的需要。分析了医疗数据的特点,并以慢肺阻疾病诊断的数据集为例,阐述了把医疗数据转换成事务数据格式的方法,描述了关联规则挖掘在医疗数据分析中应用所遇到的难题,针对这些难题给出了一些算法的改进措施,并用数据进行测试。结果表明,此算法优于原来算法,它可以减少产生的规则的数量,从而能快速发现有趣的医疗关联规则。  相似文献   

13.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

14.
频繁项集挖掘算法综述   总被引:4,自引:0,他引:4  
该文基于频繁项集挖掘算法的研究现状,采用自底向上遍历搜索、自顶向下遍历搜索和混合遍历搜索的分类方法,对现有的频繁项集挖掘算法进行归纳分类,分析和比较了各类别中具有代表性的挖掘算法,总结每种算法各方面的特性.同时,对一些特殊的频繁项集挖掘算法也作了简单介绍.旨在使读者全面掌握频繁项集挖掘算法目前的研究水平,便于研究者对已有的算法进行改进,提出具有更好性能的新的分类算法,也便于使用者在应用时对算法的选择和使用.  相似文献   

15.
频繁项集挖掘是数据挖掘过程中的重要部分,传统数据挖掘算法中常用Apriori算法和FP增长算法来挖掘频繁项集。在实际应用中,传统算法往往不能用于频繁更新的数据库,采用IMBT数据结构能从不断更新的数据库中挖掘频繁项集,但是这将导致存储空间不足和运行效率低下的问题。基于MapReduce的增量数据挖掘能够有效解决这些问题,通过对比基于MapReduce的增量数据挖掘和传统增量数据挖掘的运行时间可以证明,基于Mapeduce的增量数据挖掘更高效。  相似文献   

16.
不产生候选的快速投影频繁模式树挖掘算法   总被引:8,自引:0,他引:8  
1.概述近年来,对事务数据库、时序数据库和各种其它类型数据库中的频繁模式挖掘的研究越来越普及。许多先前的研究都是采用Apriori或类似的候选产生—检查迭代算法,使用候选项集来找频繁项集。这些算法都基于一种重要的反单调的Apriori性质:任何非频繁的(k—1)-项集都不可能是频繁k-项集的子集。因此,如果一个候选k-项集的(k—1)-子集不在频繁(k—1)-项集中,则该候选也不可能是频繁的,从而可  相似文献   

17.
1.引言频繁项集的挖掘是数据挖掘课题中的一个很重要的方面,然而频繁项集的挖掘过程通常会产生数目庞大的频繁项集,并且其中的绝大多数并不是客户所期望得到的,因而使挖掘过程的效果和效率都大打折扣。  相似文献   

18.
数据挖掘是一个庞大的计算过程,频繁项集挖掘是教据挖掘中很重要的一部分。本文提出一种基于数据挖掘的存储频繁项集结构——BFp-tree,对频繁项集进行预处理,并将其存储在磁盘上,以支持在线挖掘要求。BFp-tree利用共享前缀和后缀的特点节省存储空间,对稠密的数据集压缩效率较高。  相似文献   

19.
数据挖掘当下已成为十分热门的话题,人们对它将随之带来长远的经济社会效益清晰可见。面对现今要处理如此庞大的数据量,高效、准确地挖掘出数据中的有效信息十分必要。在数据挖掘领域中,关联规则旨在找出数据集中项与项之间未知的关系,进而可以从挖掘出的数据对象信息中得到我们需要的信息。Apriori算法是关联规则里的一项基本算法,也是数据挖掘领域十大经典算法之一,可以利用它挖掘数据集中数据项间的潜在关系。  相似文献   

20.
基于矩阵的频繁项集挖掘算法   总被引:9,自引:3,他引:6       下载免费PDF全文
如何高效地挖掘频繁项集是关联规则挖掘的主要问题。该文根据集合论和矩阵理论,提出一种基于矩阵的频繁项集挖掘算法。该算法只需扫描数据库一次,就能把所有事务转化为矩阵的行,把所有项和项集转化为矩阵的列,在对矩阵操作时能一次性产生所有频繁项集,且当支持度阈值改变时无需重新扫描数据库。实验结果表明,该算法的挖掘效率高于Apriori算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号