首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
关联规则是数据挖掘领域的一个重要研究方向。针对关联规则的增量挖掘问题,该文提出一种快速算法FIAFAR。算法使用CAN-树存储原始交易数据库,弥补了FP-树的不足,适应于增量挖掘以及最小支持度变化的情况。采用子父节点指针的设计,可以快速生成条件模式树,提高算法的效率。实验验证了算法的有效性。  相似文献   

2.
一种基于FP树的挖掘关联规则的增量更新算法   总被引:15,自引:0,他引:15  
挖掘关联规则是数据挖掘领域的一个重要研究方向.人们已经提出了许多用于高效地发现大规模数据库中关联规则的算法,但对关联规则维护问题的研究却比较少.该文在FP树的基础上,引入支持度函数的慨念,对FP树进行改造,提出了一种关于挖掘关联规则的增量更新算法IFP—growth.该算法既考虑了数据集中数据的增加.同时又考虑了数据集中数据的减少等情况下关联规则的维护问题,并且还可以把增量更新的5种情形简化为3种情形.使用本算法来挖掘关联规则可以避免生成大量的候选项目集,而且非常高效.  相似文献   

3.
关联规则的挖掘是数据挖掘研究中的一个重要课题,目前已经提出了许多用于发现海量事务库中关联规则的算法以及更新已经发现的关联规则的算法。但是在关联规则的更新算法中,都是基于支持度变化和事务库变化的研究,目前没有人研究当事务库中的属性发生变化时,如何高效地更新关联规则的问题。针对这种情况,提出了三种基于属性变化的增量关联规则挖掘算法ACA+(Attribute Change Algorithm)和ACA-(ACA1-),从而解决了该问题。  相似文献   

4.
多最小支持度策略的关联规则挖掘方法   总被引:9,自引:0,他引:9  
关联规则的数据挖掘是当今数据挖掘领域的重要内容之一 .国内现有的关联规则挖掘算法大多是在最小支持度的限定条件下 ,发现挖掘数据的各属性间的所有关联型知识 .而事实上由于基于不同数据属性的事件的发生频率是不同的 ,这样仅通过唯一的支持度限定的挖掘就无法正确反映挖掘对象本身的特征 .本文从客观事实的本质出发 ,在原有 Apriori算法的基础上 ,采用了一种多支持度的关联规则挖掘策略 .最后通过实验结果表明 ,这种挖掘方法能够更加准确和高效地进行知识挖掘 .  相似文献   

5.
关联规则挖掘是数据挖掘领域中最活跃的一个分支。目前提出的许多关联规则挖掘算法需要多次扫描数据库并产生大量候选项集,影响了挖掘效率。针对加权关联规则挖掘算法中多次扫描数据库影响算法性能的问题,对其进行了优化,采取了以空间换时间的思路,提出一种基于向量的概率加权关联规则挖掘算法。以求概率的方式设置项目属性的权值,通过矩阵向量存储结构保存事务记录,只需扫描一次数据库,并且采用不同的剪枝策略及加权支持度和置信度的计算方式。使用数据实例进行模拟实验,结果表明此算法明显提高了挖掘效率。  相似文献   

6.
挖掘关联规则是数据挖掘领域的一个重要研究方向,人们已经提出了许多用于发现数据库中关联规则的算法,但对关联规则的增量维护问题的研究较少.深入分析了增量更新情况,使用了目前较高效的最大频繁模式挖掘算法FP-Max,并对其进行改进.基本思想:①基于FP-树;②考虑了数据集中,数据增加情况下FP-树的更新;③对FP-Max算法进行改进来更新、维护已经挖掘出来的最大频繁模式.  相似文献   

7.
通过分析和比较现有的关联规则挖掘算法,针对本研究的问题,采用一种改进的基于兴趣度的增量挖掘算法,该算法既适用于动态数据库的更新挖掘,又适用于最小支持度和最小置信度变化的更新挖掘.然后将其运用于推荐选课系统中,通过对学生已有成绩数据库信息和己选课信息进行深层次的数据挖掘,获取合理、可靠的课程结构关联规则.本系统既考虑课程之间关联规则的相关性,又考虑学生的学习能力和学习兴趣,为选课推荐服务提供更好的支持.  相似文献   

8.
在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。  相似文献   

9.
邓广彪 《数字社区&智能家居》2014,(31):7237-7240,7243
在数据库中增加数据且调整最小支持度时,数据库中关联规则会发生变化,为从数据量和最小支持度同时发生变化的数据库中快速获取频繁项集,发现变化后的关联规则,通过对FIM和AIUA算法进行分析,提出一种结合两种算法优点的增量数据关联规则挖掘My_FIM_AIUA算法,该算法能减少数据库扫描次数,减少候选项集数量。通过实验表明My_FIM_AIUA算法能在数据量和最小支持度同时变化时快速找到频繁项集,提高挖掘增量数据关联规则的速度。  相似文献   

10.
一般的关联规则发现算法使用的都是支持度、置信度框架.但是在增量的数据挖掘过程中,该类算法却需要不断改变支持度、置信度,使得算法本身效率下降,并缺乏可说服性,比如Apriori算法.为了解决该类问题,使用兴趣度框架对增量的数据进行了关联规则挖掘,比较了基于支持度、置信度框架的算法(如Apriori,FUP算法)和基于兴趣度的算法之间的优缺点.试验结果表明:兴趣度能够有效地筛选关联规则,在进行增量的数据挖掘的情况下得到的关联规则总是小于等于支持度、置信度(Aprori)算法挖掘出的规则.  相似文献   

11.
在支持度和事务库发生变化时,如何有效地更新关联规则的问题是目前数据挖掘研究的热点。但当事务库中的属性发生变化时,如何高效地更新关联规则的问题一直都没有引起研究人员的重视。ACA+和ACA-算法对单属性增减后的关联规则进行了研究,在此基础上,提出了解决多属性增减的增量关联规则更新算法MACA+和MACA-。通过建立事务-属性矩阵有效地解决了该问题。  相似文献   

12.
提出利用模糊属性集和关联规则的支持度获得高效率的关联规则增量更新挖掘的方法。首先对输入数据集进行模糊离散化,确定相应的模糊属性集,模糊支持数和各属性原先的模糊聚类中心;然后检查是否满足最小支持度条件,将其添加到更新后的模糊频繁属性集集合中;最后比较模糊频繁属性集和负边界的变化,得到最终更新后的模糊频繁属性集和相应的关联规则。采用实际飞行数据验证了该算法可以避免反复和多层扫描数据库的时间消耗问题,模糊关联规则挖掘算法可以高效和准确提取增量关联规则。  相似文献   

13.
RMAIN: Association rules maintenance without reruns through data   总被引:1,自引:0,他引:1  
Association rules are well recognised as a data mining tool for analysis of transactional data, currently going far beyond the early basket-based applications. A wide spectrum of methods for mining associations have been proposed up to date, including batch and incremental approaches. Most of the accurate incremental methods minimise, but do not completely eliminate reruns through processed data. In this paper we propose a new approximate algorithm RMAIN for incremental maintenance of association rules, which works repeatedly on subsequent portions of new transactions. After a portion has been analysed, the new rules are combined with the old ones, so that no reruns through the processed transactions are performed in the future. The resulting set of rules is kept similar to the one that would be achieved in a batch manner. Unlike other incremental methods, RMAIN is fully separated from a rule mining algorithm and this independence makes it highly general and flexible. Moreover, it operates on rules in their final form, ready for decision support, and not on intermediate representation (frequent itemsets), which requires further processing. These features make the RMAIN algorithm well suited for rule maintenance within knowledge bases of autonomous systems with strongly bounded resources and time for decision making. We evaluated the algorithm on synthetic and real datasets, achieving promising results with respect to either performance or quality of output rules.  相似文献   

14.
一种增量时态关联规则算法   总被引:1,自引:1,他引:0  
由于时态数据都有较强的时间性,即数据会随时间的变化而变化,当前已发现的某些关联规则可能不再有效。因此,我们提出了一种时态约束下的增量式关联规则挖掘算法,随着新数据的产生,增量地更新关联规则集,尽可能地只处理新数据。该算法主要是根据时态事件模型和序列模型以及Apriori原则,在快速更新算法思想基础上产生的,在实际应用中有很大的意义,能对股票数据、银行数据、超市数据和气象数据等时态数据进行分析和研究。  相似文献   

15.
改进的增量式关联规则维护算法   总被引:10,自引:0,他引:10  
挖掘关联规则是数据挖掘研究的一个重要方面,而维护已发现的关联规则同样是重要的。在分析现有的关联规则算法IUA的基础上,指出了该算法的不足和错误之处,并加以改正,进而提出了一种改进的增量式更新算法EIUA。EIUA算法解决了在数据库D不变的情况下,当最小支持度和最小置信度二阈值发生变化时如何高效更新关联规则的问题。实验分析表明了新算法的有效性和优越性。  相似文献   

16.
一种新的关联规则增量式挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张健沛  杨悦  刘卓 《计算机工程》2006,32(23):43-44,6
针对数据库不断更新变化及现实生活中大多只对近期数据感兴趣的特点,该文提出了一种基于滑动窗口过滤器的关联规则增量式挖掘算法(SWFAI算法)。该算法通过分组及时舍弃挖掘过程中生成的非频繁项目集,有效降低主存压力,减少对数据库的扫描次数,能够对时变数据库进行高效地关联规则挖掘。通过实验证明了该算法能够有效地进行关联规则的挖掘,并在效率上有较大提高。  相似文献   

17.
一种实用的关联规则增量式更新算法   总被引:2,自引:0,他引:2  
薛锦  陈原斌 《计算机工程与应用》2003,39(13):212-213,217
关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。该文提出了一种实用的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应的关联规则的更新问题,并对其性能进行了分析。  相似文献   

18.
Mining fuzzy association rules for classification problems   总被引:3,自引:0,他引:3  
The effective development of data mining techniques for the discovery of knowledge from training samples for classification problems in industrial engineering is necessary in applications, such as group technology. This paper proposes a learning algorithm, which can be viewed as a knowledge acquisition tool, to effectively discover fuzzy association rules for classification problems. The consequence part of each rule is one class label. The proposed learning algorithm consists of two phases: one to generate large fuzzy grids from training samples by fuzzy partitioning in each attribute, and the other to generate fuzzy association rules for classification problems by large fuzzy grids. The proposed learning algorithm is implemented by scanning training samples stored in a database only once and applying a sequence of Boolean operations to generate fuzzy grids and fuzzy rules; therefore, it can be easily extended to discover other types of fuzzy association rules. The simulation results from the iris data demonstrate that the proposed learning algorithm can effectively derive fuzzy association rules for classification problems.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号