首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
一个改进的关联规则的频繁项目集数据挖掘算法   总被引:1,自引:0,他引:1  
吴振光 《计算机科学》2007,34(9):145-147
在关联规则中的Apriori算法,具有天生的缺陷,运行效果很不理想。为了克服Apriori算法的缺点,本文提出了一个改进的算法:在产生频繁项目集组合时,只需扫描数据库一次,这样就可以有效率地降低I/O的存取时间,更快速地找出符合使用者需求的关联规则。仿真实验表明,该算法是有效的。  相似文献   

2.
常璐璐  刘春霞 《福建电脑》2007,(9):37-37,19
论述了关联规则研究情况,给出了关联规则的概念与分类,分析和评价了关联规则的主要挖掘方法与维护方法,最后提出了关联规则研究的发展趋势。  相似文献   

3.
关联规则挖掘则是数据挖掘中最重要的分支之一。它着重研究大量数据中项集之间有趣的关联或相关关系,一个典型的例子就是购物篮分析。该过程可以分析出哪些商品顾客倾向于在一起购买,从而可以为商店经理提供比较好的商店布局方式。例如,通过分析,我们发现,顾客在购买了一台计算机以后,一般都会去购买财务管理软件,那么我们就可以把计算机和财务管理软件放在比较近的位置,以增加销售量。这里主要介绍了关联规则挖掘的经典算法,Apriori算法,同时给出了关联规则中的基本概念,然后分析了算法的运行效率。提出了改进的方法。  相似文献   

4.
关联规则挖掘中若干关键技术的研究   总被引:36,自引:0,他引:36  
Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:① 如何确定候选频繁项目集和计算项目集的支持数;② 如何减少候选频繁项目集的个数以及扫描数据库的次数.目前已提出了许多改进方法来解决第2个问题,并已取得了很好的效果.然而,对于第1个问题,仍沿用Apriori算法中的解决方案,其运算量是较大的.为此,提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该算法与Apriori类算法相结合,可以进一步提高算法的执行效率,实验结果也表明算法是有效、快速的.  相似文献   

5.
基于相对约简格的关联规则研究   总被引:2,自引:0,他引:2  
研究了相对约简格中的概念与关联规则中的频繁项目集的内在联系,给出了利用相对约简格提取关联规则的方法和相应算法。  相似文献   

6.
一、引言 IBM科学家Rakesh Agrawal于1993年提出了用于交易的关联规则数据挖掘算法,该算法把基于关联规则的数据挖掘分为两大步,第一步,从交易中发现频繁项目集;第二步,从已发现的频繁项目集中生成所需的关联规则。由于第二步相对简单,且Rakesh Agrawal已给出了一个有效算法来生成所需的关联规则,因此人们对基于关联规则的数据挖掘进行的大量的研究都集中在第一步,即如何从交易集中快速生成频繁项目集。但研究发现,Rakesh Agrawal生成算法虽然能正确有效地生成关联规则,但生成的关联规则具有相当大的冗余性。例如:设关联规则a->(b,c)表示买面包(a)的人中有80%的人买了啤酒(b)和香烟(c),则按Agrawal生成算法,一定会生成如下几条关联规则:  相似文献   

7.
介绍了关联规则的基本概念,总结了关联规则的分类及各种挖掘算法,并对一些典型算法进行了介绍,最后,展望了关联规则挖掘的下一步研究方向。  相似文献   

8.
介绍了关联规则的基本概念,总结了关联规则的分类及各种挖掘算法,并对一些典型算法进行了介绍,最后展望了关联规则挖掘的下一步研究方向。  相似文献   

9.
基于项目序列集操作的关联规则挖掘算法   总被引:29,自引:0,他引:29  
最大频繁项目序列集的生成是影响关联规则挖掘的关键问题,传统的算法是通过对事务数据库的多次扫描实现的,最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的I/O代价来获得更高的效率,随着计算机性能的提高,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能,该文首先给出项目序列集和它的基本操作的严格定义,然后在此基础上提出了一个称为ISS-DM的最大频繁项目序列集生成算法。ISS-DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列集的,最后作者对这一算法的时间和空间效率进行了理论分析和实验验证。  相似文献   

10.
正负关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
本文提出了一种快速有效的正、负关联规则挖掘算法 MPNAR。另外,针对关联规則挖掘算法中支持数计算的复杂性,提出了一种基于二进制形式的支持数计算方法。实验结果表明算法 MPNAR 是有效和可行的。  相似文献   

11.
最大频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,最大频繁项目集的快速挖掘算法研究是当前研究的热点。传统的最大频繁项目集挖掘算法要多遍扫描数据库并产生大量的候选项目集。为此,该文提出了基于F-矩阵的最大频繁项目集快速挖掘算法FMMFIBFM,FMMFIBFM采用FP-tree的存储结构,仅须扫描数据库两遍且不产生候选频繁项目集,有效地提高了频繁项目集的挖掘效率。实验结果表明,FMMFIBFM算法是有效可行的。  相似文献   

12.
发现频繁项集是关联规则挖掘中最基本、最重要的问题.提出了一种基于二进制表示的频繁项集挖掘算法,并利用二进制的性质快速产生候选项集并计算其支持度.算法总体性能在一定程度上得到了提高.  相似文献   

13.
一种新的关联规则的高效挖掘算法   总被引:1,自引:2,他引:1  
在Apriori算法的基础上,提出了一种新的算法,该算法在运行过程中根据支持度来不断缩小原有事务数据库,同时采用了一种新的方法产生候选集,促进了关联规则挖掘中效率的提高。  相似文献   

14.
分析了Apriori算法关于发现频繁项集的方法及其效率,提出了一种基于上三角项集矩阵的频繁项集挖掘优化算法。本算法只需要扫描数据库一次,不产生候选项目集,也不使用逐层迭代的方法,大大提高了频繁项集的发现效率。  相似文献   

15.
分析了Apriori算法关于发现频繁项集的方法及其效率,提出了一种基于上三角项集矩阵的频繁项集挖掘优化算法。本算法只需要扫描数据库一次,不产生候选项目集,也不使用逐层迭代的方法,大大提高了频繁项集的发现效率。  相似文献   

16.
关联规则增量更新算法研究   总被引:7,自引:0,他引:7  
该文研究了关联规则更新的第一类问题,即数据库记录增加时的关联规则更新问题。首先,该文讨论了现有的FUP算法的基本思想,然后在此基础上对其进行改进,提出了改进的FUP算法EFUP,给出了具体实现方法。最后在不同方面针对EFUP与FUP算法进行了实验比较,说明了EFUP相对于FUP算法的优点。  相似文献   

17.
本文根据关联规则和分类规则的概念与表示形式,指出在关联规则挖掘过程中如果指定挖掘与一个确定的项相关联,那么就是分类规则挖掘了,论述了分类规则是特殊情况下的关联规则,并指出在这种特殊情况下,关联规则所具有的特征;然后根据这一论述,提出了一种在关联规则挖掘算法中利用限制条件概率分布来发现分类规则的算法。  相似文献   

18.
基于时序数据的延迟关联规则的挖掘   总被引:5,自引:0,他引:5  
时序数据是一种常见的数据类型,也是数据挖掘的重要研究内容。采用关联规则挖掘时序数据是较新的研究领域。明确提出挖掘延迟关联规则的模型,根据延迟规则的定义提出两种挖掘方法,并针对两种算法进行了相关的对比分析。  相似文献   

19.
本文提供了在数据挖掘中的关联规则的分类方式,对一些典型算法进行了分析,最后提出了广义的关联规则挖掘算法AR_SET,利用集合“或”、“与”运算求解频集(FrequentItemset),提高了挖掘的效率和速度。  相似文献   

20.
基于关联规则的教学质量评价数据挖掘   总被引:4,自引:0,他引:4  
课堂教学质量评价是教学质量评估的重要内容,是提高教学质量的重要途径和手段.讨论利用数据挖掘方法中的Apriori算法对教学质量评价数据进行关联规则挖掘,挖掘教学质量与考核对象,考核指标之间的内在关系,为教学管理提供决策支持.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号