首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
一种新的关联规则的高效挖掘算法   总被引:1,自引:2,他引:1  
在Apriori算法的基础上,提出了一种新的算法,该算法在运行过程中根据支持度来不断缩小原有事务数据库,同时采用了一种新的方法产生候选集,促进了关联规则挖掘中效率的提高。  相似文献   

2.
一种高效的关联规则挖掘算法研究   总被引:2,自引:1,他引:2  
一般关联规则挖掘算法分为两步:第一步是发现频繁项目集;第二步是利用频繁项目集产生关联规则。文章讨论了现今关联规则挖掘算法的特点和不足,同时提出一种效率更高的挖掘算法。与其它算法不同的是,该算法侧重于知识领域的使用和关联规则系统应用的预备。  相似文献   

3.
一、引言 IBM科学家Rakesh Agrawal于1993年提出了用于交易的关联规则数据挖掘算法,该算法把基于关联规则的数据挖掘分为两大步,第一步,从交易中发现频繁项目集;第二步,从已发现的频繁项目集中生成所需的关联规则。由于第二步相对简单,且Rakesh Agrawal已给出了一个有效算法来生成所需的关联规则,因此人们对基于关联规则的数据挖掘进行的大量的研究都集中在第一步,即如何从交易集中快速生成频繁项目集。但研究发现,Rakesh Agrawal生成算法虽然能正确有效地生成关联规则,但生成的关联规则具有相当大的冗余性。例如:设关联规则a->(b,c)表示买面包(a)的人中有80%的人买了啤酒(b)和香烟(c),则按Agrawal生成算法,一定会生成如下几条关联规则:  相似文献   

4.
基于分布数据库的快速关联规则挖掘算法   总被引:8,自引:0,他引:8  
关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些”或”、”与”、”异或”等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。  相似文献   

5.
正负关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
本文提出了一种快速有效的正、负关联规则挖掘算法 MPNAR。另外,针对关联规則挖掘算法中支持数计算的复杂性,提出了一种基于二进制形式的支持数计算方法。实验结果表明算法 MPNAR 是有效和可行的。  相似文献   

6.
常璐璐  刘春霞 《福建电脑》2007,(9):37-37,19
论述了关联规则研究情况,给出了关联规则的概念与分类,分析和评价了关联规则的主要挖掘方法与维护方法,最后提出了关联规则研究的发展趋势。  相似文献   

7.
在多支持度关联规则挖掘算法中,针对最小支持度的选取问题,提出一种基于分段函数的多支持度关联规则挖掘算法.在多支持度算法中挖掘频繁集的时候,最小支持度由项集最小项支持度的最小值、最大值和给定的参考值所决定,这样避免了采用最小值作为最小支持度算法的时间复杂度高和存在无效规则的问题,以及采用最大值致使剪枝程度过大而造成规则遗漏的问题.通过实验结果表明了该算法的有效性.  相似文献   

8.
一种新的关联规则增量式更新算法   总被引:8,自引:0,他引:8  
首先提出了一个新的概念-后备频繁项目集,其次给出了一种新的增量式更新算法NEWFUP,最后介绍了在某中小型商业企业的事务数据库中该算法的实现。  相似文献   

9.
关联规则提取中对Apriori算法的一种改进   总被引:25,自引:0,他引:25  
关联规则的提取是数据挖掘中的重要研究课题,该文对关联规则提取中的Apriori算法进行了深入研究,指出了该算法的某些不足,提出了一种改进算法。实验结果表明,该算法性能明显优于Apriori算法,具有较高的推广价值。  相似文献   

10.
一种基于关联规则挖掘的改进算法   总被引:1,自引:0,他引:1  
在介绍关联规则的QAIS算法的基础上,指出了该算法的不足之处,分析了项集的构成特点,提出了一种新的存储项集的数据结构,进而形成了QAIS算法改进算法,谊算法能够处理较大的数据集,增强了算法的适应柱。  相似文献   

11.
基于属性分组的高效挖掘关联规则算法   总被引:6,自引:0,他引:6  
挖掘频繁项集在数据挖掘中有着重要的作用。目前,关于频繁项集的挖掘问题已经提出了一些算法,虽然实现了一次扫描数据库即可以发现所有的频繁项集,但是当属性数目很多时,算法的执行效率下降很快。论文首次提出了利用属性分组作为挖掘关联规则的工具,给出了基于属性分组的频繁项集挖掘算法,用矩阵来存储数据库属性间的信息并提取频繁项集,而且不产生候选项集。经实验验证该算法是快速有效的。  相似文献   

12.
Apriori算法是经典的频繁项目集生成算法,在数据挖掘界起着里程碑的作用。但是该算法要求多次扫描可能非常大的交易数据库。文章在Apriori算法的基础上,提出了一种改进的关联规则挖掘算法-GBARM。该算法能够使得每次扫描的事务数大大减少,并且能够逐步减小候选k-项集的规模,从而改善算法的性能。  相似文献   

13.
一种有效的隐私保护关联规则挖掘方法   总被引:26,自引:3,他引:23  
隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法.首先将数据干扰和查询限制这两种隐私保护的基本策略相结合,提出了一种新的数据随机处理方法,即部分隐藏的随机化回答(randomized response with partial hiding,简称RRPH)方法,以对原始数据进行变换和隐藏.然后以此为基础,针对经过RRPH方法处理后的数据,给出了一种简单而又高效的频繁项集生成算法,进而实现了隐私保护的关联规则挖掘.理论分析和实验结果均表明,基于RRPH的隐私保护关联规则挖掘方法具有很好的隐私性、准确性、高效性和适用性.  相似文献   

14.
基于关联规则挖掘中的Apriori算法,在一定条件下,进行局部改进来提高挖掘的时间效率。这种改进本身并不会需要多大的系统开销,但是可以使算法在某些情况下运行得更快些。  相似文献   

15.
为解决外包关联规则挖掘中的隐私保护问题,针对现有基于标准布隆过滤器算法时间效率低、可逆性较差等不足,提出一种基于独立映射空间布隆过滤器的算法。将原始事务数据库转换成布隆过滤器的形式,根据转换后每个事务向量的海明重量进行事务压缩,利用矩阵列向量进行“与”运算,计算候选项集的支持度,从而得出频繁项集。实验结果表明,与原算法相比,该算法在保证误判率的同时,能提高时间效率,具有良好的可逆性和安全性,实用性更强。  相似文献   

16.
基于数组的关联规则挖掘算法   总被引:4,自引:1,他引:3  
文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,利用数组的结构特性来提高挖掘效率。  相似文献   

17.
关联规则挖掘是数据挖掘中的一个重要研究内容.为了高效、快速地从事务数据库中挖掘出频繁项集,针对数据挖掘的经典关联规则Apriori算法的瓶颈问题提出了改进的方法.算法将事物数据库映射到布尔型数组中,然后所有的操作都针对数组元素值展开.这样大大减少了数据库的扫描次数.算法利用数组的随机访问特性及布尔型数据的简单"与"操作,直接产生频繁项集,而不产生大量的候选项集.经理论分析和实验结果显示该算法在效率上明显优于Apriori 算法.  相似文献   

18.
在对关联规则中的Apriori算法进行了深入研究的基础上,提出了基于矩阵结构的关联规则挖掘算法.由于这个算法只需要对交易数据库进行一次搜索,给出了一种简单有效的逐步缩减交易数据库的方法,能大量减少所需的I/O次数,因此提高了Apriori算法的效率,并改进了数据挖掘算法的性能.  相似文献   

19.
对关联规则的挖掘是数据挖掘中一个重要的问题 .通过挖掘 free项目集来挖掘关联规则已被证明是一种十分高效的方法 .Seg Free算法将数据库分成许多分段并在这些分段中查找 free项目集 .它只耗用很小的额外内存来存储在每个分段中项目集的支持度 ,却能极大的减少项目集匹配的时间 ,而项目集匹配的时间是整个挖掘过程的瓶颈 .在真实数据集上的试验已显示了它良好的性能 .它还能使用在其他的数据挖掘任务中  相似文献   

20.
基于幂集的关联规则挖掘算法研究   总被引:15,自引:2,他引:13  
首次提出了利用幂集作为挖掘关联规则的工具,给出了基于幂集的关联规则挖掘算法。该算法有效解决了传统算法中需对数据库多次扫描的不足,实现了对数据库一次扫描就可挖掘出所有频繁集的功能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号