首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
Apriori算法是发现频繁项目集的经典算法,但是该算法需反复扫描数据库,因此效率较低。针对Apriori算法,GBARM(Group Based Association Rules Mining)算法对事务集进行压缩,并且在统计Ck中各项集的支持频度时,逐步减小Ck的规模,从而改善算法的性能。  相似文献   

2.
Apriori算法是发现频繁项目集的经典算法,但是该算法需反复扫描数据库,因此效率较低。针对Apriori算法,GBARM (Group Based Association Rules Mining)算法对事务集进行压缩,并且在统计Ck中各项集的支持频度时,逐步减小Ck的规模,从而改善算法的性能。  相似文献   

3.
关联规则挖掘则是数据挖掘中最重要的分支之一。它着重研究大量数据中项集之间有趣的关联或相关关系,一个典型的例子就是购物篮分析。该过程可以分析出哪些商品顾客倾向于在一起购买,从而可以为商店经理提供比较好的商店布局方式。例如,通过分析,我们发现,顾客在购买了一台计算机以后,一般都会去购买财务管理软件,那么我们就可以把计算机和财务管理软件放在比较近的位置,以增加销售量。这里主要介绍了关联规则挖掘的经典算法,Apriori算法,同时给出了关联规则中的基本概念,然后分析了算法的运行效率。提出了改进的方法。  相似文献   

4.
基于数组的关联规则挖掘算法   总被引:4,自引:1,他引:3  
文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,利用数组的结构特性来提高挖掘效率。  相似文献   

5.
基于矩阵的关联规则挖掘算法   总被引:3,自引:0,他引:3       下载免费PDF全文
针对一些经典的关联规则算法进行分析,提出一种基于矩阵的高效关联规则挖掘算法。该算法把交易数据库转化为0-1矩阵形式,只需进行一次数据库搜索,使用逻辑运算方法发现频繁项集并计算它的支持计数,加快了频繁k项目集的验证速度,能大量减少所需的I/O次数,减小了存储空间。实验表明,新算法执行效率明显优于Apriori算法。  相似文献   

6.
基于改进Apriori算法的关联规则挖掘研究   总被引:2,自引:0,他引:2  
朱其祥  徐勇  张林 《微机发展》2006,16(7):102-104
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法———Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。  相似文献   

7.
介绍了关联规则挖掘算法的基本原理和基本概念,包括项目、项目集、置信度、支持度等。重点介绍了经典的Ariori算法、优化的FP_Growth算法,介绍了关联规则分类与挖掘的步骤与常用性质,对常见关联规则挖掘算法的效率作了必要的比较。  相似文献   

8.
基于排序矩阵和树的关联规则挖掘算法   总被引:6,自引:0,他引:6  
最大频繁项集的生成是影响关联规则挖掘的关键问题,Apriori算法从大量的候选频繁项集产生频繁项集的过程是非常耗时的过程。本文提出了一种新的算法,该算法结合项集的有序特性构造矩阵,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。  相似文献   

9.
关联规则是数据挖掘的主要技术之一,是描述数据库中一组数据项之间的某种潜在关系的规则.以学生CET4成绩数据为研究对象,运用关联规则挖掘算法Apriori算法,找出学生CET4成绩中听力、阅读、写作、综合测试四部分成绩之间的关系,以及这四部分成绩与总分之间的关系.  相似文献   

10.
教学评价是院校最重要的工作之一,而科学的评教方法又显得尤为重要。本文介绍一种更适合于关系型数据库关联规则挖掘的、基于SQL的频繁项关联规则挖掘算法,并将其应用于教学评价。通过对大量的样本数据进行试验,得出了应用以往传统的教学评价方法所无法得到重要的教学参考信息。  相似文献   

11.
针对资源共享系统开放式特征,提供了一种启发式方法,在分析Apriori的基础上,在网络资源共享系统下进行关联规则挖掘.与传统方法相比主要有两点区别:一是通过在网络中设立一个超节点来保存处理数据;二是通过和节点实时的动作序列相比,添加一个近似频繁集反映动态变化.这种方法通过设定全局和节点的启发式规则,可以有效提取节点动作序列的关联,从而提高目标资源的定位能力,节省网络带宽开销.实验结果表明该方法是高效可行的.  相似文献   

12.
XML凭借其诸多优点,在短短的时间内迅速成为表示和交换信息的标准。大量XML数据的涌现给数据挖掘提出了新的挑战。传统关联规则挖掘是基于关系数据库的,因此现有许多XML数据关联规则挖掘的方法都或多或少地利用关系数据库-即把XML数据文档映射成关系数据库来完成的。在仔细研究了XML数据的访问接口后,给出了一个基于Apriori算法可直接从XML文档挖掘关联规则的类接口,并且在.NET平台下用C#语言实现了。  相似文献   

13.
一种有效的挖掘关联规则更新方法   总被引:1,自引:0,他引:1  
王新 《计算机应用》2005,25(6):1360-1361,1372
在挖掘关联规则过程中,用户往往需要多次调整(增加或减少)最小支持度,才能获得有用的关联规则。给出一个利用已存信息有效产生新候选项目集的PSI算法,结果表明每次扫描数据库时能有效地减少候选项目集的数。  相似文献   

14.
关联规则在股票板块联动分析中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
Apriori算法是关联规则挖掘中的经典算法,针对Apriori算法的不足进行了一些改进。新算法使用垂直数据格式,并改进了产生候选项的连接方法。为了研究股票板块的联动关系,将改进算法应用于股票板块指数分析中。实验结果表明,改进算法能快速发现板块之间的联动关系,对股市分析和投资决策有一定的指导作用。  相似文献   

15.
随着网络技术的广泛应用,网络系统的安全变得至关重要。入侵检测是保护网络系统安全的关键技术和重要手段,但现行的入侵检测达不到实际应用的需求。关联规则挖掘可以从海量数据中发现正常和异常的行为模式,有效地检测入侵。因此,研究关联规则的数据挖掘对于提高入侵检测的准确性和时效性具有非常重要的意义。  相似文献   

16.
高效的关联规则快速更新算法   总被引:2,自引:0,他引:2       下载免费PDF全文
挖掘关联规则的两大经典算法Apriori和FP-tree算法都是以批处理方式处理所有事务。但在实际应用中,新事务频繁地出现,这就需要不断更新关联规则。为了提高更新效率,有效减少扫描原数据库的次数,基于次频繁项的概念,在快速更新频繁模式树(FUFP-tree)算法的基础上,提出了一种改进的算法。实验结果表明新算法具有良好的性能。  相似文献   

17.
针对在关联规则中的Apriori算法进行了深入研究的基础上,提出了一种基于压缩矩阵的关联规则挖掘算法(CMApriori算法)。该算法只需扫描一次数据库,在矩阵上采用事务压缩和项目压缩技术,节省了数据占用的内存空间。在对建立好的压缩矩阵上只需进行简单的计数运算即可得到频繁项集。仿真实验证明:该算法与Apriori算法相比,运算效率大大提高。  相似文献   

18.
一种基于事务压缩的关联规则优化算法   总被引:10,自引:0,他引:10  
通过对Apriori算法挖掘过程进行分析,提出了一种基于事务压缩的关联规则挖掘算法.该算法充分利用Apriori性质,通过减少候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率.并在Apriori算法的基础上设计了Apriori改进算法.  相似文献   

19.
基于粗糙集的关联规则挖掘方法   总被引:1,自引:0,他引:1  
对粗糙集进行了相关研究,并提出一种以粗糙集理论为基础的关联规则挖掘方法,该方法首先利用粗糙集的特征属性约简算法进行属性约简,然后在构建约简决策表的基础上应用改进的Apriori算法进行关联规则挖掘。该方法的优势在于消除了不重要的属性,减少了属性数目和候选项集数量,同时只需一次扫描决策表就可产生决策规则。应用实例及实验结果分析表明该方法是一种有效而且快速的关联规则挖掘方法。  相似文献   

20.
本文采用一种基于布尔矩阵的频繁集挖掘算法。该算法直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法的连接和剪枝,通过不断压缩支持矩阵,不仅节约了存储空间,还提高了算法的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号