首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
关联规则是数据挖掘领域的一个重要分支。随着数据库的不断变化,关联规则的增量更新变得尤为重要。为了更好地对关联规则进行有效的更新,对已经提出的经典的关联规则更新算法FUP和IUA算法进行分析,指出其优缺点;提出了一个改进的关联规则算法PFUP。该算法减少了候选项集数目,从而减少扫描数据库D的次数,提高了效率。  相似文献   

2.
语言值关联规则的增量更新   总被引:1,自引:0,他引:1  
数据库并非是静态的,而是要经常更新。数据库发生插入、删除和修改等操作后,一方面有可能产生新的关联规则,另一方面现有的一些规则可能不再适用,所以要对关联规则进行维护。提出一种语言值关联规则的增量更新算法。算法通过维护原先的频繁语言值属性集的集合、负边界及其语言值属性集的支持数,使得语言值关联规则更新过程最多需要扫描整个数据库一次。实例分析表明该算法能够有效更新语言值关联规则,并且减少重复计算的开销。  相似文献   

3.
一种实用的关联规则增量式更新算法   总被引:2,自引:0,他引:2  
薛锦  陈原斌 《计算机工程与应用》2003,39(13):212-213,217
关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。该文提出了一种实用的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应的关联规则的更新问题,并对其性能进行了分析。  相似文献   

4.
一种有效的关联规则增量式更新算法   总被引:8,自引:2,他引:6  
关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。文章提出了基于频繁模式树的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应关联规则的更新问题,并对其性能进行了分析。  相似文献   

5.
由于数据库的频繁更新,时态数据库隐藏了大量的未知信息,因此针对实时更新的数据库应产生相应的时态关联规则.虽然关联规则算法已经被深入广泛地研究,但在文本数据中时态关联规则算法的研究还不多见.在深入了解时态关联规则算法及其在文本数据中的研究价值后,以时态文本为对象进行了时态关联规则算法的研究,建立了时态文本数据的时间表示模型,提出了文本时态关联规则算法SPFM,最后通过实验对算法进行了有效性验证,结果表明该算法是正确可行的.  相似文献   

6.
对当最小支持度和最小置信度都不变的情况下数据库中数据量增加时的关联规则增量更新问题进行了研究.给出了一个简单的判定公式,依据项集在原数据库DB和新添加的数据库db中的实际支持度来判定该项集在更新后的数据库DB∪db中是否频繁.对Apriori算法进行了改进,使其能适应本增量更新算法.对BISIUA算法思想进行了详细的论述,并在此基础上给出了该算法的形式化描述.由理论分析可知,BIsIUA算法能有效提高关联规则增量更新的效率.  相似文献   

7.
基于最近挖掘结果的关联规则更新算法   总被引:3,自引:0,他引:3  
Apriori算法是著名的关联规则挖掘算法,它必须对数据库进行多次遍历,针对关联规则的维护问题,提出利用最近一次关联规则的挖掘结果进行更新的算法,仅需对数据库进行两次遍历,提高了关联规则的更新效率。  相似文献   

8.
基于频繁模式树的关联规则增量式更新算法   总被引:48,自引:1,他引:48  
研究了大型事务数据库中关联规则的增量式更新总是,提出了一种基于频繁模式树的关联规则增量式更新算法,以处理最小支持度或事务数据库发生变化后相应关联规则的更新问题,并对其性能进行了分析。  相似文献   

9.
关联规则挖掘已取得了许多有效的算法,但是当事物数据库发生动态变化时,或数据库保持不变,而最小支持度和最小可信度发生变化时,关联规则的高效更新仍然是个复杂的问题.给出一种新的关联规则的挖掘算法.新的算法只需扫描数据库D一次,减少了I/O次数,为关联规则的更新打下很好的基础.  相似文献   

10.
对现有关联规则更新算法中的增量式更新算法进行分析,发现在决策者优先关注最大频繁项目集的情况下,该算法不能以较少的数据库遍历次数快速获取最大频繁项集。针对该算法的不足,提出一种基于逆向搜索的方式进行关联规则更新的算法。该算法生成新增项集的所有频繁项集,通过将其中最大频繁项集跟原项集中最大频繁项集进行拼接、修剪,从中获得更新后的最大频繁项集。实例结果表明,该算法既降低了关联规则更新过程中对数据库的遍历次数,又实现了优先获取最大频繁项目集。  相似文献   

11.
Shared-nothing并行事务数据库系统中规则的挖掘与更新算法   总被引:1,自引:0,他引:1  
关联规则是数据挖掘中的一个重要研究内容.本文提出了Shared—nothing并行事务数据库系统(简称SNPDBS)中一种快速的关联规则挖掘算法SNPMAR,并考虑当最小支持度发生变化后SNPDBS中关联规则的高效更新问题,提出了一种有效的关联规则更新算法SNPIUA.  相似文献   

12.
In this paper, we study the issues of mining and maintaining association rules in a large database of customer transactions. The problem of mining association rules can be mapped into the problems of finding large itemsets which are sets of items brought together in a sufficient number of transactions. We revise a graph-based algorithm to further speed up the process of itemset generation. In addition, we extend our revised algorithm to maintain discovered association rules when incremental or decremental updates are made to the databases. Experimental results show the efficiency of our algorithms. The revised algorithm is a significant improvement over the original one on mining association rules. The algorithms for maintaining association rules are more efficient than re-running the mining algorithms for the whole updated database and outperform previously proposed algorithms that need multiple passes over the database. Received 4 August 1999 / Revised 18 March 2000 / Accepted in revised form 18 October 2000  相似文献   

13.
Wang  Ling  Gui  Lingpeng  Zhu  Hui 《Applied Intelligence》2022,52(2):1389-1405

Traditional temporal association rules mining algorithms cannot dynamically update the temporal association rules within the valid time interval with increasing data. In this paper, a new algorithm called incremental fuzzy temporal association rule mining using fuzzy grid table (IFTARMFGT) is proposed by combining the advantages of boolean matrix with incremental mining. First, multivariate time series data are transformed into discrete fuzzy values that contain the time intervals and fuzzy membership. Second, in order to improve the mining efficiency, the concept of boolean matrices was introduced into the fuzzy membership to generate a fuzzy grid table to mine the frequent itemsets. Finally, in view of the Fast UPdate (FUP) algorithm, fuzzy temporal association rules are incrementally mined and updated without repeatedly scanning the original database by considering the lifespan of each item and inheriting the information from previous mining results. The experiments show that our algorithm provides better efficiency and interpretability in mining temporal association rules than other algorithms.

  相似文献   

14.
郑涛  张伟 《计算机工程》2003,29(13):103-104,111
数据挖掘的一个重要方面是挖掘关联规则,目前已提出了包括经典算法Apriori在内的许多算法,而在实际关联规则的挖掘过程中,用户将需要不断调整用于描述用户兴趣程度的阈值:最小支持度和最小置信度。如何维护已发现的关联规则变得至关重要。该文提出的GIUA算法解决了在数据库D不变的情况下,最小支持度和最小置信度发生变化时关联规则的维护问题,最大效率地利用原有结果,通过动态分组将连接步和修剪步的循环减到最少,并尽可能地将挖掘过程并行化。  相似文献   

15.
概化关联规则挖掘作为数据挖掘领域一个重要的拓展性研究课题,首先提出了一种概化扩展自然序树(generalized extended canonical-order tree,GECT)结构及其增量挖掘算法GECT-IM.该算法对原始分类事务数据库只扫描一次,就可以将所有交易信息映射至一棵压缩格式的GECT,然后通过对更新交易数据集扫描得到更新数据集中各项集的计数,结合相关性质及运算就可以发现大部分更新后的概化频繁项集;其次,针对GECT规模较大以及GECT-IM 算法仍然可能需要遍历初始GECT树的局限,在界定数据库更新和重构概念的基础上,基于一种可量化度量的准最小支持度阈值,提出了一种改进的准频繁概化扩展自然序树(pre-large generalized extended canonical-order tree,PGECT)结构及其增量挖掘算法PGECT-IM.由于有效避免了对初始GECT进行遍历的情形,从而进一步提升了概化关联规则增量挖掘效率.实验证明,提出的概化关联规则增量挖掘算法 GECT-IM 及其优化算法PGECT-IM,比现有增量挖掘算法具有更高的挖掘效率和更好的扩展性.  相似文献   

16.
采掘有效的关联规则   总被引:8,自引:0,他引:8  
关联规则挖掘是数据挖掘中重要的研究课题.为了减少关联规则挖掘中的无效关联规则。我们分析了其原因,提出了二种改进方法,即在衡量标准中增加影响度或相对置信度.根据它们的大小,我们将强关联规则分为正关联规则、无效关联规则、负关联规则,我们给出了用新衡量标准挖掘关联规则的改进算法,并用Visual FoxPro进行了试验.实验表明:新方法能明显减少无效关联规则的数目.  相似文献   

17.
徐前方  肖波  郭军 《计算机工程》2008,34(1):40-42,4
目前已提出的告警序列关联规则挖掘算法都受到最小支持度的限制,仅能够得到频繁告警序列间的关联规则。针对该问题,该文提出一种以高相关度、高置信度为条件,基于相关度统计的挖掘算法。并对其数据更新问题进行了研究,提出一种增量式挖掘算法。实验结果显示,该算法可以高效、准确地挖掘出电信网络告警数据库中频繁和非频繁告警序列间的关联规则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号