首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
一种新的关联规则增量式更新算法   总被引:8,自引:0,他引:8  
首先提出了一个新的概念-后备频繁项目集,其次给出了一种新的增量式更新算法NEWFUP,最后介绍了在某中小型商业企业的事务数据库中该算法的实现。  相似文献   

2.
基于项目序列集操作的关联规则挖掘算法   总被引:29,自引:0,他引:29  
最大频繁项目序列集的生成是影响关联规则挖掘的关键问题,传统的算法是通过对事务数据库的多次扫描实现的,最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的I/O代价来获得更高的效率,随着计算机性能的提高,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能,该文首先给出项目序列集和它的基本操作的严格定义,然后在此基础上提出了一个称为ISS-DM的最大频繁项目序列集生成算法。ISS-DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列集的,最后作者对这一算法的时间和空间效率进行了理论分析和实验验证。  相似文献   

3.
一种高效的关联规则挖掘算法研究   总被引:2,自引:1,他引:2  
一般关联规则挖掘算法分为两步:第一步是发现频繁项目集;第二步是利用频繁项目集产生关联规则。文章讨论了现今关联规则挖掘算法的特点和不足,同时提出一种效率更高的挖掘算法。与其它算法不同的是,该算法侧重于知识领域的使用和关联规则系统应用的预备。  相似文献   

4.
林松  马亨冰 《福建电脑》2008,24(12):75-76
本文就最小支持度和最小置信度不变而数据库中增加数据记录时,关联规则的维护问题进行研究,提出了一种新的关联规则维护算法,该算法只需扫描一遍数据库。  相似文献   

5.
正负关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
本文提出了一种快速有效的正、负关联规则挖掘算法 MPNAR。另外,针对关联规則挖掘算法中支持数计算的复杂性,提出了一种基于二进制形式的支持数计算方法。实验结果表明算法 MPNAR 是有效和可行的。  相似文献   

6.
吴文妹 《福建电脑》2006,(6):117-118
在支持度不变的情况下,如何从已更新的数据库中高效的挖掘关联规则?本文在分析了已有的诸关联规则挖掘与更新算法的基础上,提出了一种新关联规则更新算法,该算法仅需扫描数据库一次,即可得到关联规则,从而使算法的效率得到提高。  相似文献   

7.
基于子规则的关联规则生成算法   总被引:4,自引:0,他引:4  
关联规则是数据挖掘中重要的课题之一。传统的由频繁项目集产生关联规则的方法由于要考虑频繁项目集的每一个非空子集,当频繁项目集的长度较长时代价较大。文中提出用K项子频繁项目集导出关联规则以后得到的有用信息以指导K 1项父频繁项目集产生强关联规则,由于利用了前面已有的有用信息,当频繁模式长度很长时,或者可信度较高时,效率尤其显著。  相似文献   

8.
基于最近挖掘结果的关联规则更新算法   总被引:3,自引:0,他引:3  
Apriori算法是著名的关联规则挖掘算法,它必须对数据库进行多次遍历,针对关联规则的维护问题,提出利用最近一次关联规则的挖掘结果进行更新的算法,仅需对数据库进行两次遍历,提高了关联规则的更新效率。  相似文献   

9.
对关联规则的挖掘是数据挖掘中的一个重要问题。在挖掘之前先对数据库扫描,以获得一些辅助的信息,能极大地加速挖掘过程。ARSC算法以建立一种称为分段信息表的数据结构来提高关联规则挖掘的效率。分段信息表所占用的空间很小,生成所需要的时间也很短,却能够获得很好的性能。它还有很强的通用性,能在多种数据挖掘任务和多种算
算法中使用。  相似文献   

10.
关联规则的发现是数据挖掘中的一个重要问题,本文在经典关联规则的基础上提出了关联规则的扩展模型。并给予了算法的讨论。  相似文献   

11.
在阐述了关联规则算法Apriori要义的基础上,解读了其在Weka系统中的具体实现。详细分析了weka源代码中实现Apriori算法的基础核心类包和算法实现类包中的关键类以及这些类内部的关键函数及变量,为探索通过weka源代码学习和研究数据挖掘算法及其实现方法提供了很好的帮助。  相似文献   

12.
罗光蕊  刘杰 《计算机工程》2010,36(12):36-38
针对关联规则数量巨大并且存在极大冗余的问题,提出无冗余告警关联规则产生算法。从规则本身的关联性和等效性上定义规则的冗余性,通过构造频繁闭项集邻接图发现无冗余告警关联规则,用户可以通过发现的规则推导出其余所有冗余规则,并且得到用户所需的规则形式。该方法不仅能够减少关联规则数量,而且不会带来规则丢失。仿真结果表明,在相同的数据集、最小支持度门限和最小置信度门限条件下,无冗余关联规则数量和产生时间都小于冗余关联规则数量和产生时间,支持度门限越小,差距越显著。  相似文献   

13.
Attribute Generation Based on Association Rules   总被引:1,自引:0,他引:1  
A decision tree is considered to be appropriate (1) if the tree can classify the unseen data accurately, and (2) if the size of the tree is small. One of the approaches to induce such a good decision tree is to add new attributes and their values to enhance the expressiveness of the training data at the data pre-processing stage. There are many existing methods for attribute extraction and construction, but constructing new attributes is still an art. These methods are very time consuming, and some of them need a priori knowledge of the data domain. They are not suitable for data mining dealing with large volumes of data. We propose a novel approach that the knowledge on attributes relevant to the class is extracted as association rules from the training data. The new attributes and the values are generated from the association rules among the originally given attributes. We elaborate on the method and investigate its feature. The effectiveness of our approach is demonstrated through some experiments. Received 6 December 1999 / Revised 28 October 2000 / Accepted in revised form 9 March 2001  相似文献   

14.
关联规则挖掘是发现大量数据中项集之间有趣的关联或相关联系的技术方法,关联规则挖掘Apriori算法需要多次扫描数据库,时空复杂度过高。针对该算法的局限性,本文提出了基于项编码的关联规则挖掘算法CA(Coding-based Apriori),只需要第一遍扫描数据库并对每个项完成编码,以后的过程都是针对编码进行,不需要多次扫描数据库。相同条件下的实验结果表明,优化后的算法能有效地提高关联规则挖掘的效率。  相似文献   

15.
现有的数据挖掘算法多是集中式环境下的数据挖掘处理,但目前的大型数据库多以分布式的形式存在,针对分布式数据挖掘算法FDM及其改进算法中存在的频繁项集丢失问题和网络通信开销过高的问题,提出了一种改进的基于关联规则的分布式数据挖掘算法LTDM,LTDM算法引入了映射标示数组机制,可以在保证频繁项集完整性的同时降低网络的通信开销。实验结果证明了算法的有效性。  相似文献   

16.
关联规则算法的研究   总被引:1,自引:0,他引:1  
Apriori算法是发现频繁项目集的经典算法,但是该算法需反复扫描数据库,因此效率较低.文中针对传统的Apri-ori算法需要多次扫描数据库,由此导致的性能瓶颈及效率问题,提出了一种改进的关联规则挖掘算法(AAC算法).该算法只需一次扫描数据库即可完成所有频繁项集的搜索,极大地提高了算法的效率.  相似文献   

17.
一种新的关联规则挖掘思想   总被引:3,自引:0,他引:3  
提出的新的关联规则挖掘思想(以下称为“记录加权型关联规则挖掘”)是为每一条历史记录加上相应的权重值,以反映“不同记录对挖掘结果贡献不同”这一数据挖掘的实际要求。在此基础上,还对支持度、可信度和挖掘算法作了相应的修正,提出了RWApriori-Tid算法。  相似文献   

18.
最简关联规则及其挖掘算法   总被引:3,自引:0,他引:3       下载免费PDF全文
李杰  徐勇  王云峰  王友 《计算机工程》2007,33(13):46-48
传统关联规则挖掘算法往往产生过多规则而难以被决策者所采用。针对该问题,文章从应用的角度提出了最简关联规则,其特点是后项只包括一种产品,同时追求规则前项产品项数的最小化,在此基础上给出了一种最简关联规则挖掘算法。利用该算法得到的最简关联规则集包括的规则数量大为减少且能得出与全部关联规则集相同的决策,避免了大量的冗余挖掘,提高了挖掘效率和应用效果。  相似文献   

19.
挖掘关联规则算法的优化处理   总被引:9,自引:0,他引:9  
在挖掘关联规则的执行过程中,早期循环生成最大项目集的过程是很重要的。文中提出基于哈希表的算法,对生成侯选项目集的过程进行了优化,尤其是对生成二维侯选项目集更是有效。由于在早期循环中,生成侯选项目集的势较小,使得能更有效地修剪数据库,从而减小了后期循环的计算代价,同时也减小了I/O请求。  相似文献   

20.
在研究多段支持度数据挖掘算法的基础上提出并行挖掘相联规则的算法。给出了在并行条件下以负载平衡为目的的种子项集的划分的贪心算法策略。基于多段支持度特征,为减少各个处理机之间的制约,提出按事务长度进行数据集划分的方案,并具体实现了多段支持度的并行算法。实验结果表明该算法具有很高的效率,特别是在双CPU情况下,并行算法的效率接近顺序算法的两倍,如果把算法修正和推广到群集环境下,会更一步增加相联规则的实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号