首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
可增量更新的关联规则挖掘算法   总被引:3,自引:0,他引:3  
本文给出了一种新奇有效的增量式关联规则挖掘算法,以处理因事务数据库内容增加后相应关联规则的更新问题,该算法认真研究了关联规则挖掘过程中的数据存储的结构,充分利用以前挖掘的结果,从而大大减少了对数据的重复扫描,提高了数据挖掘算法的效率。  相似文献   

2.
一种关联规则增量更新算法   总被引:22,自引:0,他引:22  
针对事务数据库的内容不断增加后相应关联规则的更新问题,提出了一种简单高效的增量式关联规则挖掘算法SFUA,并和已有的FUP算法进行了分析比较。  相似文献   

3.
交易数据库的加权关联规则增量更新算法   总被引:3,自引:3,他引:3  
针对文献犤1犦提出的加权关联规则挖掘算法,文章提出了交易数据库的加权关联规则增量更新算法(DWARIUA算法)。该算法充分利用已存在的频繁项目集,因此,算法是有效而可行的。  相似文献   

4.
一种高效的关联规则增量更新算法   总被引:3,自引:0,他引:3  
对挖掘关联规则中FUP算法的关键思想以及性能进行了研究,提出了改进的FUP算法SFUP。该算法充分利用原有挖掘结果中候选频繁项集的支持数,能有效减少对数据库的重复扫描次数,并通过实验对这两种算法进行比较,结果充分说明了SFUP算法的效率要明显优于FUP算法。  相似文献   

5.
在增量式关联规则更新算法的研究中,关于负增量式更新算法的研究比较少。提出了一种实用的在支持度和置信度不变的情况下数据集规模减小的负增量关联规则更新算法。算法在如何减少数据集的扫描次数,如何充分利用现有的信息减少候选集的规模等方面进行了研究,给出了算法的具体实现。通过分析,算法是可行的。  相似文献   

6.
在增量式关联规则更新算法的研究中,关于负增量式更新算法的研究比较少。提出了一种实用的在支持度和置信度不变的情况下数据集规模减小的负增量关联规则更新算法。算法在如何减少数据集的扫描次数,如何充分利用现有的信息减少候选集的规模等方面进行了研究,给出了算法的具体实现。通过分析,算法是可行的。  相似文献   

7.
基于矩阵的关联规则增量更新算法   总被引:1,自引:1,他引:0  
该算法用以处理事务数据库不变而最小支持度发生变化后相应关联规则的更新问题。它在充分利用ABM算法挖掘结果的基础上,不需要重新扫描数据库,也不需要额外地为其分配内存单元就能挖掘出所有新的频繁项目集,实验分析证明了UBM算法的正确性和高效性。  相似文献   

8.
针对频繁项集增量更新的问题,提出算法FIU。该算法将保存了数据库事务的FP-tree存储在磁盘上,当挖掘新支持度阈值的频繁项集时,只需从磁盘上读入FP-tree,再挖掘新支持度阈值下的频繁项集。当新增数据库事务记录后,首先建立新项目表,然后根据新项目表建立新增事务记录的FP-tree,读入存储在磁盘上的FP-tree,抽取出所有的事务记录,再插入到新FP-tree中.从而得到增量更新后的FP-tree。最后在增量更新后的FP-tree上挖掘频繁项集。实验证明,FIU算法执行时间不随数据库大小变化,与其他算法相比有较好的性能。  相似文献   

9.
负增量式关联规则更新算法   总被引:3,自引:0,他引:3  
模式维护是数据挖掘中一个具有挑战性的任务.现有的增量式关联规则更新算法主要解决两种情况下的维护问题:一是最小支持度不变,而数据量增加;二是数据量不变,而改变最小支持度.本文提出了一种负增量关联规则更新算法.实验表明,该算法是有效的.  相似文献   

10.
针对数据库和最小支持度同时发生变化的情况,提出了HIUA算法。该算法利用常用的哈希存储结构,数据结构简单,操作方便、可行,并且只需要扫描数据库一次。同时,通过对其测试结果与经典的Apriori算法进行比较,表明了该算法充分利用了原有的信息,提高了算法的效率。  相似文献   

11.
基于改进Apriori算法的关联规则挖掘研究   总被引:2,自引:0,他引:2  
朱其祥  徐勇  张林 《微机发展》2006,16(7):102-104
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法———Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。  相似文献   

12.
分析了基于关联规则的数据挖掘技术原理,描述了经典的Apriori算法的原理及在实际应用中的弊端,并在此基础上运用精减频繁项集、运用多关键字排序重排频繁项集、压缩数据库方式以及算法中止条件方面对Apriori算法进行改进,并成功应用于高校学位预警系统中。  相似文献   

13.
 Apriori算法在搜索频繁项集过程中,通常需要对数据库进行多次的重复扫描和产生大量无用的候选集,针对此问题提出一种基于矩阵约简的Apriori改进算法。该算法只需扫描一次数据库,将数据库信息转换成布尔矩阵,根据频繁k-项集的性质推出的结论来约简数据结构,有效地降低无效候选项集的生成规模。通过对已有算法的对比,验证该算法能有效地提高挖掘频繁项集的效  相似文献   

14.
基于十字链表的Apriori改进算法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对Apriori算法中存在的不足,提出一种把事务数据库映射到十字链表中的改进算法。该算法可以减少连接数据库的次数及事务记录的扫描次数。Apriori算法与改进算法的性能对比分析表明,改进算法能有效提高执行效率。  相似文献   

15.
互联网技术在带给我们一个信息爆炸时代的同时,也极大地增加了从浩瀚数据堆里寻找有用知识的困难程度。面对不断拓展的数据规模,对海量信息的搜索、管理以及实时处理能力将面临严峻的挑战。文章主要介绍基于Apriori算法关联规则的具体应用。  相似文献   

16.
负关联规则增量更新算法   总被引:1,自引:1,他引:0       下载免费PDF全文
讨论负关联规则的更新问题。与正关联规则增量更新不同,负关联规则不仅存在于频繁项集中,更多存在于非频繁项集中。针对该问题提出一种负关联规则增量更新算法NIUA,利用改进的Apriori算法以及集合的性质挖掘出频繁、非频繁项集和负关联规则。实验结果表明,该算法是可取的。  相似文献   

17.
一种Apriori算法的改进   总被引:2,自引:0,他引:2  
Apriori算法在处理关联规则分析时,当数据立方体数据稠密时,实现迭代性质将需要非常复杂的数据结构。针对上述问题,本文提出了一种改进的Apriori-ni算法,该算法没有用迭代性质来剪枝,即不基于迭代属性的算法。对Apriori算法和Apriori-ni算法进行了分析和比较,实验结果表明,当项目集很多时,Apriori-ni算法能节约计算开销,从而提高算法的效率。  相似文献   

18.
关联规则挖掘是数据挖掘中的一个重要研究内容.为了高效、快速地从事务数据库中挖掘出频繁项集,针对数据挖掘的经典关联规则Apriori算法的瓶颈问题提出了改进的方法.算法将事物数据库映射到布尔型数组中,然后所有的操作都针对数组元素值展开.这样大大减少了数据库的扫描次数.算法利用数组的随机访问特性及布尔型数据的简单"与"操作,直接产生频繁项集,而不产生大量的候选项集.经理论分析和实验结果显示该算法在效率上明显优于Apriori 算法.  相似文献   

19.
对挖掘关联规则中的Apriori算法的一种改进   总被引:1,自引:1,他引:0  
对挖掘关联规则的Apriori算法关键思想以及性能进行了研究,给出该算法的一个改进算法,该改进算法提高了原算法的性能,并从实验中得出相关结果.  相似文献   

20.
在阐述了关联规则算法Apriori要义的基础上,解读了其在Weka系统中的具体实现。详细分析了weka源代码中实现Apriori算法的基础核心类包和算法实现类包中的关键类以及这些类内部的关键函数及变量,为探索通过weka源代码学习和研究数据挖掘算法及其实现方法提供了很好的帮助。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号