共查询到19条相似文献,搜索用时 93 毫秒
1.
基于PC-树的关联规则挖掘方法 总被引:4,自引:0,他引:4
关联规则是数据挖掘的一种常用方法,特别是用在货篮分析中,而关联规则的经典算法Apriori及其改进算法的时间复杂度和空间复杂度都比较高,对于数据库更新、用户定义最小支持度等动态数据挖掘的成本太高。针对这种情况,提出了用PC-树寻找频繁项集的算法,实现高效的动态数据挖掘。 相似文献
2.
一种高效的多层和概化关联规则挖掘方法 总被引:4,自引:1,他引:3
通过对分类数据的深入研究,提出了一种高效的多层关联规则挖掘方法:首先,根据分类数据所在的领域知识构建基于领域知识的项相关性模型DICM(domain knowledge-based item correlation model),并通过该模型对分类数据的项进行层次聚类;然后,基于项的聚类结果对事务数据库进行约简划分;最后,将约简划分后的事务数据库映射至一种压缩的AFOPT树形结构,并通过遍历AFOPT树替代原事务数据库来挖掘频繁项集.由于缩小了事务数据库规模,并采用了压缩的AFOPT结构,所提出的方法有效地节省了算法的I/O时间,极大地提升了多层关联规则的挖掘效率.基于该方法,给出了一种自顶向下的多层关联规则挖掘算法TD-CBP-MLARM和一种自底向上的多层关联规则挖掘算法BU-CBP-MLARM.此外,还将该挖掘方法成功扩展至概化关联规则挖掘领域,提出了一种高效的概化关联规则挖掘算法CBP-GARM.通过大量人工随机生成数据的实验证明,所提出的多层和概化关联规则挖掘算法不仅可以确保频繁项集挖掘结果的正确性和完整性,还比现有同类最新算法具有更好的挖掘效率和扩展性. 相似文献
3.
增量更新关联规则挖掘主要解决事务数据库中交易记录不断更新和最小支持度发生变化时关联规则的维护问题。针对目前诸多增量更新关联规则挖掘算法存在效率低、计算成本高、规则难以维护等问题,提出一种基于倒排索引树的增量更新关联挖掘算法。该算法有效地将倒排索引技术与树型结构相结合,使得交易数据库中的数据不断更新和最小支持度随应用环境不同而不断改变时,以实现无需扫描原始交易数据库和不产生候选项集的情况下生成频繁项集。实验结果表明,该算法只需占用较小的存储空间、且检索项集的效率较高,能高效地解决增量更新关联规则难以维护的问题。 相似文献
4.
随着大型数据库系统在各行业普及,数据库中存储的数据量急剧增大,数据挖掘是从海量数据中挖掘有效或重要信息的过程。关联规则挖掘作为数据挖掘的重要研究课题,被广泛地应用。伴随挖掘数据库的规模不断发生变化,对数据的需求也会有所不同,如何从扩展数据库中高效地对已经推导出的关联规则进行更新具有非常重要的应用价值,这就是所谓的增量式挖掘关联规则的问题。 相似文献
5.
数据挖掘是从海量数据库中挖掘有效或重要信息的过程.普通的关联规则挖掘是数据挖掘的一种基本的方法,但随着时间的推移,挖掘数据库的规模会发生不断变化,人们对数据的需求也会有所不同,如何从扩展数据库中高效地对已经推导出的关联规则进行更新,然后再利用更新的关联规则进行数据挖掘,这就是增量式挖掘关联规则的方法. 相似文献
6.
通过研究项集之间的关系,发现大项集之间存在着一种特定的关系,即k-项集一定是由一个(k-1)-项集加上一个单独的项构成的。基于这种项集关系,本文提出基于前缀树的TIUA算法,算法摆脱了传统算法多次迭代的不足,并利用挖掘出的结果,只需扫描一次数据库,就能满足各种要求,通过以空间换时间,达到提高挖掘效率的目的。 相似文献
7.
Feng Song 《数字社区&智能家居》2008,(Z1)
随着数据库技术的不断发展及数据库管理系统的广泛应用,大型数据库系统己经在各行各业普及,数据库中存储的数据量急剧增大,数据挖掘便是从海量数据库中挖掘有效或重要信息的过程。关联规则挖掘是数据挖掘领域一个非常重要的研究课题,被广泛地应用于商业界、医疗保险、金融业、电信部门等。随着时间的推移,挖掘数据库的规模会发生不断变化,人们对数据的需求也会有所不同,因此如何从扩展数据库中高效地对已经推导出的关联规则进行更新具有非常重要的应用价值,这就是所谓的增量式挖掘关联规则的问题。 相似文献
8.
9.
基于频繁模式树的分布式关联规则挖掘算法 总被引:1,自引:0,他引:1
提出一种基于频繁模式树的分布式关联规则挖掘算法(DMARF).DMARF算法设置了中心结点,利用局部频繁模式树让各计算机结点快速获取局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.DMARF算法采用顶部和底部策略,能大幅减少候选项集,降低通信量.理论分析和实验结果均表明了DMARF算法是快速而有效的. 相似文献
10.
11.
12.
一种基于前缀广义表的关联规则增量式更新算法 总被引:20,自引:1,他引:20
关联规则挖掘是数据挖掘研究的一个重要方面,关联规则的高效维护算法研究是当前研究的热点.传统更新算法与Apriori算法框架一致,要多遍扫描数据库并产生大量的候选项目集.为此,该文对FP-tree进行了改进,引入了前缀广义表——PG-List,并提出了基于PG-List的关联规则挖掘(MARBPGL)与增量式更新算法(IUABPGL).算法MARBPGL仅须扫描数据库两遍,算法IUABPGL在最坏的情况下仅须扫描原数据库一遍,扫描新增数据库两遍,且两个算法均无须生成候选项目集,避免了产生“知识的组合爆炸”,提高了挖掘和维护的效率.理论分析和实验结果表明该文提出的算法是有效可行的. 相似文献
13.
14.
发现频繁项目集是关联规则挖掘的关键问题,而发现的过程是高花费的。因此,要求对增量挖掘算法进行深入研究。这使得关联规则的更新成为数据挖掘技术中的一个重要内容。文中就关联规则的增量式更新问题进行了探讨,针对最小支持度发生变化时的增量式更新算法(IUA)的不足,提出了改进算法(AIUA),在保证算法有效的同时提高了效率。 相似文献
15.
一种实用的关联规则增量式更新算法 总被引:2,自引:0,他引:2
关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。该文提出了一种实用的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应的关联规则的更新问题,并对其性能进行了分析。 相似文献
16.
一种基于事务时间分割的关联规则增量式更新方法 总被引:1,自引:0,他引:1
文章介绍了一种增量式关联规则更新方法,其核心思想是,将长事务以时间分割,分成一个连续的情节集合,当前情节期间获得的信息,依赖于当前的事务子集以及前面情节期间已经发现的信息。仅使用更新的事务和前面阶段的挖掘结果,增量式地产生频集。用Apriori类算法作为局部过程来产生频集,给出了具体的动态挖掘算法。 相似文献
17.
基于矩阵的关联规则增量更新算法 总被引:1,自引:1,他引:0
该算法用以处理事务数据库不变而最小支持度发生变化后相应关联规则的更新问题。它在充分利用ABM算法挖掘结果的基础上,不需要重新扫描数据库,也不需要额外地为其分配内存单元就能挖掘出所有新的频繁项目集,实验分析证明了UBM算法的正确性和高效性。 相似文献
18.
关联规则挖掘中增量式更新算法的研究 总被引:8,自引:1,他引:8
关联规则的更新是数据挖掘技术中的一个重要内容,能否有效地挖掘出动态事务数据库中的频繁项目集或关联规则是衡量一个算法好坏的关键因素。该文系统地介绍了关联规则的增量式更新问题,给出或提出了相应的算法,并举例说明了算法的执行过程。 相似文献
19.
一种增量时态关联规则算法 总被引:1,自引:1,他引:0
由于时态数据都有较强的时间性,即数据会随时间的变化而变化,当前已发现的某些关联规则可能不再有效。因此,我们提出了一种时态约束下的增量式关联规则挖掘算法,随着新数据的产生,增量地更新关联规则集,尽可能地只处理新数据。该算法主要是根据时态事件模型和序列模型以及Apriori原则,在快速更新算法思想基础上产生的,在实际应用中有很大的意义,能对股票数据、银行数据、超市数据和气象数据等时态数据进行分析和研究。 相似文献