首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 359 毫秒
1.
经常性周期关联规则的研究   总被引:3,自引:1,他引:2  
近年来,数据挖掘问题引起了人工智能、数据库、统计学等各方面的专家的广泛兴趣,文首先提出了关联规则的发现,随后如文等进行了广泛的研究,但以上的工作都是将数据库看成是一个整体,没有考虑时间段的问题。本文考虑了发现经常性周期关联规则的问题。假如在一系列有一定周期间隔的时间单元内,一条关联规则的发生次数(即支持度和信度同时超过指定值的次数)达到用户指定的比率(最小经常性信度),就称此规则是一条“经常性周期关联规则”。本文提出了发现这种规则的多种不同方法并通过实验比较了它们的性能。相信这些技术将有助于确认销售趋势与用户需求。下面首先给出了经常性周期关联规则的数学定义,然后考虑直接扩展已有的关联规则发现算法来解决这个问题。  相似文献   

2.
不可约关联规则及其应用   总被引:3,自引:0,他引:3  
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数常常是巨大的,本文主要考虑不可约关联规则,不可约关联规则数通常比全部规则数少,讨论利用不可约关联规则可导出其它关联规则,并给出其算法。  相似文献   

3.
一种实用的关联规则增量式更新算法   总被引:2,自引:0,他引:2  
薛锦  陈原斌 《计算机工程与应用》2003,39(13):212-213,217
关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。该文提出了一种实用的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应的关联规则的更新问题,并对其性能进行了分析。  相似文献   

4.
一种有效的关联规则增量式更新算法   总被引:6,自引:2,他引:6  
关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。文章提出了基于频繁模式树的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应关联规则的更新问题,并对其性能进行了分析。  相似文献   

5.
一种基于FP树的挖掘关联规则的增量更新算法   总被引:15,自引:0,他引:15  
挖掘关联规则是数据挖掘领域的一个重要研究方向.人们已经提出了许多用于高效地发现大规模数据库中关联规则的算法,但对关联规则维护问题的研究却比较少.该文在FP树的基础上,引入支持度函数的慨念,对FP树进行改造,提出了一种关于挖掘关联规则的增量更新算法IFP—growth.该算法既考虑了数据集中数据的增加.同时又考虑了数据集中数据的减少等情况下关联规则的维护问题,并且还可以把增量更新的5种情形简化为3种情形.使用本算法来挖掘关联规则可以避免生成大量的候选项目集,而且非常高效.  相似文献   

6.
一种新的基于FP-Tree的关联规则增量式更新算法   总被引:2,自引:0,他引:2  
挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的.针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问题进行了研究,提出了一种新的基于频繁模式树的关联规则增量式更新算法,并对该算法进行了分析和讨论.  相似文献   

7.
数据挖掘被称为数据库中的知识发现,是一个跨学科的研究领域。关联规则分析是数据挖掘中一个重要的课题,用于发现存在于数据库中的项或属性间的关联联系,这些联系是事先未知且隐藏的。关联规则的研究主要集中在生成频繁项集的挖掘算法,通过对几种主要关联规则的算法分析,利用Apriori算法研究再生资源系统中关联规则的确定,从而实现物资的二次销售。  相似文献   

8.
挖掘关联规则是数据挖掘领域的一个重要研究方向,人们已经提出了许多用于发现数据库中关联规则的算法,但对关联规则的增量维护问题的研究较少.深入分析了增量更新情况,使用了目前较高效的最大频繁模式挖掘算法FP-Max,并对其进行改进.基本思想:①基于FP-树;②考虑了数据集中,数据增加情况下FP-树的更新;③对FP-Max算法进行改进来更新、维护已经挖掘出来的最大频繁模式.  相似文献   

9.
频繁项集的挖掘是关联规则挖掘中一个关键的问题,典型的关联规则挖掘算法都是以数据库的多次扫描来实现的,而且不能即时反映数据库的变化,且其频繁项集的产生都只考虑了项目在数据库中出现的频度而没有考虑项目的重要性。本文提出了一种基于频繁链表的完全加权项频繁集的挖掘算法,该算法不但能动态反映数据库的变化,而且在频繁集的挖掘中只需扫描一次数据库,并根据项目的重要性程度对项目赋予了一定的权值,用以挖掘人们更感兴趣的关联规则。  相似文献   

10.
在数据库中发现具有时态约束的关联规则   总被引:50,自引:0,他引:50  
目前,国际上的关联规则研究尚未考虑时间因素.然而,时间是现实世界的固有属性,许多现实 世界数据库都存在时态语义问题.该文考察称为有效时间的时态约束问题,提出了时间区间延 展与归并技术以及新的时态关联规则发现算法,从而进一步推广了关联规则的应用.  相似文献   

11.
扩展型关联规则和原关联规则及其若干性质   总被引:6,自引:1,他引:6  
已有的关联规则模型所反映的基本上是频繁事件中所隐藏的一种积极或肯定关系,而没有反应其隐含的否定关系,在实际应用中,这种否定关系与肯定关系一样也是很重要的,在此论述的扩展型关联规则模型就能反映上述两种关系,据此可以得到更多的规则知识,此外,由于Aproiri关联规则生成方法产生的关联规则具有较大的冗余性,论述的原关联规则可以消除关联规则的这种冗余特性,挖掘原关联规则既能大大减少关联规则的数,目,又能节省规则生成时间,把扩展型关联规则和原关联规则相结合,可使得对扩展关联规则的挖掘更加有效,实验结果也支持了上述结论。  相似文献   

12.
关联规则挖掘算法中的Apriori算法利用查找频繁项集来发现数据集中的关联规则,算法思路简单容易实现;但在由k-1次频繁项集生成k次频繁项集时需反复查找数据库,效率较低,在寻找高次频繁项集时其低效性更加明显;矩阵算法是通过直接查找高次频繁项集,避免了反复查找数据库,但要存储大量的非频繁项集,且查找低次频繁项集速度较慢。文中提出的矩阵等价类算法,利用等价关系进一步降低矩阵算法的时间空间复杂度,然后通过项目相似度直接求取所有最大频繁项集。实验结果证明了算法的可行性、高效性。  相似文献   

13.
为了易于产生候选频繁项目集和计算项目集的支持数,提出了基于二进制的关联规则挖掘算法,但在搜索候选频繁项目集时仍从集合论出发,沿用传统搜索超集或子集的方法,在一定程度上效率受到了限制;为此提出了一种基于二进制的交叉挖掘关联规则算法,通过数值的递增和递减交叉方式自动产生候选频繁项集,缩短了候选频繁项的搜索空间,并在计算支持数时通过数字特征减少了扫描事务的个数,算法的效率得到了明显提高;该实验结果表明:与现有的二进制关联规则挖掘算法相比,算法是快速而有效的。  相似文献   

14.
时域数据的挖掘是数据挖掘领域经常遇到的问题。而时域关联规则的发现研究是关联规则的一个重要研究课题。该文在对周期关联规则进行深入研究的基础上,形式化定义了基本的时域关联规则概念,并提出了基于Apriori的发现周期关联规则的CCAR算法。CCAR的核心思想是首先把各项目按照周期时间分布进行聚类,根据聚类结果把每个项目分成几个动态的有效时间区域。在应用Apriori算法时,用项目的各个时间区域扩展项目集Ⅰ,然后根据作者提出的带时间属性的JOIN操作由Lk-1生成Ck,并由约简操作删除Ck中不满足条件的候选频繁项目集以提高算法的效率。算法理论分析和实验都表明CCAR是有效的。  相似文献   

15.
在由频繁项集产生关联规则时,利用提升度判断规则前、后件之间的正相关性可以避免产生一些无意义的关联。但是,这并不能保证规则前、后件中的项是正相关的,也不能减少挖掘频繁项集的时间开销。当规则的前件或后件存在负相关的项时,仍然可能产生无意义的关联规则。针对以上问题,基于数学期望,提出了正相关的频繁项集的概念,并改进了一种直接在FP-树中挖掘频繁项集的算法,挖掘出正相关的频繁项集,从而有效地解决以上问题。实验表明,该算法可以大幅度地减少所产生的频繁项集数量,显著地降低了挖掘频繁项集的时间开销。对于大型数据集,尤其是稠密型数据集,该算法具有良好的性能。  相似文献   

16.
基于本体的XML关联规则挖掘方法   总被引:1,自引:0,他引:1  
刘造新 《计算机应用》2008,28(9):2318-2320
针对传统的数据挖掘技术不能直接应用到半结构化的XML数据挖掘问题,给出了基于本体的XML关联规则挖掘方法。该方法引入领域本体和哈希技术来改进产生频繁项目集的操作和生成关联规则的操作,并且使用哈希表存储相关的领域本体,从而将数据库操作转化为对XML内存树的操作,通过理论分析和实验验证了方法的挖掘效果,论述了该方法的优点。  相似文献   

17.
一种新的加权关联规则模型   总被引:5,自引:3,他引:5  
关联规则挖掘可以发现大量数据项集之间隐含的关系,在许多领域得到了广泛应用。目前很多关联规则挖掘算法已经被提出,这些算法一般都认为每个数据项的重要性相同。然而在现实中各个项目的重要性往往不同,从决策者角度出发,他们往往会优先考虑利润较高的项目,而忽略利润较低的项目。论文分析了现有加权关联规则文献中存在的问题,提出了一种新的加权关联规则模型,给出了有效挖掘加权频繁项集的MWFI算法。  相似文献   

18.
针对焦虑抑郁患者的早期预防和诊断需求,将关联规则挖掘和压缩方法应用于焦虑抑郁障碍因素的研究,在病人数据中挖掘出与焦虑抑郁障碍相关性较高的因素集合。单独使用频繁项集挖掘算法会产生过多的频繁项集和关联规则,导致其实用性大为降低。对收集的病人数据进行预处理,采用FP-growth算法,挖掘出预处理后数据中的频繁项集,采用最新改进Bottom-Up Summarization(BUS)算法,对挖掘出的频繁项集进行压缩。同时将最后得到的关联规则与未压缩得到的关联规则、原始BUS算法及Top-K算法压缩后得到的关联规则进行对比。实验结果表明,使用改进BUS算法得到的规则数量适中、信息冗余较少而且覆盖的人群具有更高的患病风险。  相似文献   

19.
讨论分布式数据库系统中最小支持度变化时频繁项目集如何高效更新问题,提出了一种基于最小支持度变化的局部频繁项目集的更新算法ULFS和全局频繁项目集的更新算法UGFS.该算法能够充分利用已挖掘的结果.并且产生较少数量的候选频繁项目集,在求解全局频繁项目集过程中.候选局部频繁项目集支持数的通信量为O(n).将文章提出的算法用Java加以实现.并时算法性能进行了研究.实验结果表明这些算法是可行、有效的.并且具有较快的速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号