共查询到18条相似文献,搜索用时 62 毫秒
1.
发现序贯模式的增量式更新技术 总被引:1,自引:0,他引:1
本文提出一种称为FAST的增量式更新技术,以处理因最低支持的改变而引起的序贯模式的维护问题。其主要思想是再次利用在对旧的最低支持度进行处理时所获得的信息。 相似文献
2.
在数据库中自动发现广义序贯模式 总被引:9,自引:2,他引:9
本文将序贯模式的发现从单层(SingleLevel)概念扩展到多层(MultipleLevel)概念.即既允许在同层概念之间,也允许在不同层概念之间发现序贯模式,提出了发现广义序贯模式的自顶向下逐层递进的方法. 相似文献
3.
4.
基于时间窗口的增量式关联规则更新技术 总被引:2,自引:0,他引:2
文章提出了基于时间窗口的增量式关联规则更新技术.该方法不仅可以利用在先前发现过程中已经获得的结果,而且利用时间窗口,还可以在最近的数据集中进行知识发现. 相似文献
5.
序贯模式是时间相关数据库中存在的一种十分有用的知识模式,其发掘方法的研究有着十分重要的意义,本文给出了一种挖掘数据库中序贯模式的算法,通过认真地研究了挖掘过程中的中间及结果数据的存储结构,从而大大地减少了对数据库的扫描遍数,提高了算法的效率。 相似文献
6.
发现关联规则的增量式更新算法 总被引:11,自引:0,他引:11
数据挖掘是当今国际人工智能和数据库研究的新兴领域,而关联规则的更新是数据挖掘的一个重要研究内容。文章提出了IUAR算法,用于解决在元组数和最小支持度的发生变化时关联规则增量式更新问题。 相似文献
7.
一种高效的挖掘序贯模式的算法 总被引:1,自引:0,他引:1
本文给出了一种挖掘数据库中序贯模式的算法,通过认真地研究了挖掘过程中的中间及结果数据的存储结构,大大地减少了对数据库的扫描遍数,提高了算法的效率。 相似文献
8.
关联规则的增量式更新算法 总被引:180,自引:4,他引:180
关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断调整两个描述用户兴趣程度的阈值:最小支持度和最小可信度.本文提出了两种增量式更新算法——IUA(incremental updating algorithm)和PIUA(parallel incremental updating algorithm),用来解决这一关联规则高效维护问题. 相似文献
9.
10.
在原有序列模式挖掘算法基础上,提出了序列模式增量式更新的快速算法SPIU.算法充分利用原有的挖掘结果,并对候选序列集合进行有效地剪枝.测试结果表明,算法是正确和高效的,具有良好的扩放性. 相似文献
11.
关联规则增量更新算法可以减少对交易数据库的访问。根据最小支持度和交易数据库的不同变化情况,可以将增量更新问题分为若干类。已有的研究只针对某一类具体的增量更新问题,而且没有考虑多次增量更新的情形。本文将增量更新问题归约为三个基本的子问题,从而为各种不同的增量更新问题提供了统一的解决框架。在此基础上,研究了 了多次增量更新事务情况下的增量更新策略问题,通过对增量更新事务进行合理的排列,可以显著地降低对原始交易数据库的访问量。 相似文献
12.
13.
多维概念格与多维序列模式的增量挖掘 总被引:1,自引:0,他引:1
多维序列模式挖掘旨在将一个或多个背景维度信息中发现的关联模式与有序事务序列中发现的序列模式有机结合,从而为用户提供信息内容更加丰富、更具有直接应用价值的多维序列模式.目前虽有一些挖掘多维序列模式的工作,但其关联模式与序列模式的发现过程是基于不同的数据结构分开进行的.提出一种新的概念格结构——多维概念格,它是对概念格的延伸与泛化,其内涵更加丰富,不仅具有多个有序的任务内涵,而且具有多个无序的背景内涵.设计实现了基于该结构的增量式多维序列模式挖掘算法,该算法使用统一的数据模型实现关联模式与序列模式的高效同步挖掘.在合成数据集上的实验结果验证了算法的有效性.同时,算法在实际的银行数据集上的应用效果也说明了算法的实用性. 相似文献
14.
一种基于前缀广义表的关联规则增量式更新算法 总被引:20,自引:1,他引:20
关联规则挖掘是数据挖掘研究的一个重要方面,关联规则的高效维护算法研究是当前研究的热点.传统更新算法与Apriori算法框架一致,要多遍扫描数据库并产生大量的候选项目集.为此,该文对FP-tree进行了改进,引入了前缀广义表——PG-List,并提出了基于PG-List的关联规则挖掘(MARBPGL)与增量式更新算法(IUABPGL).算法MARBPGL仅须扫描数据库两遍,算法IUABPGL在最坏的情况下仅须扫描原数据库一遍,扫描新增数据库两遍,且两个算法均无须生成候选项目集,避免了产生“知识的组合爆炸”,提高了挖掘和维护的效率.理论分析和实验结果表明该文提出的算法是有效可行的. 相似文献
15.
概化关联规则挖掘作为数据挖掘领域一个重要的拓展性研究课题,首先提出了一种概化扩展自然序树(generalized extended canonical-order tree,GECT)结构及其增量挖掘算法GECT-IM.该算法对原始分类事务数据库只扫描一次,就可以将所有交易信息映射至一棵压缩格式的GECT,然后通过对更新交易数据集扫描得到更新数据集中各项集的计数,结合相关性质及运算就可以发现大部分更新后的概化频繁项集;其次,针对GECT规模较大以及GECT-IM 算法仍然可能需要遍历初始GECT树的局限,在界定数据库更新和重构概念的基础上,基于一种可量化度量的准最小支持度阈值,提出了一种改进的准频繁概化扩展自然序树(pre-large generalized extended canonical-order tree,PGECT)结构及其增量挖掘算法PGECT-IM.由于有效避免了对初始GECT进行遍历的情形,从而进一步提升了概化关联规则增量挖掘效率.实验证明,提出的概化关联规则增量挖掘算法 GECT-IM 及其优化算法PGECT-IM,比现有增量挖掘算法具有更高的挖掘效率和更好的扩展性. 相似文献
16.
现有的增量式挖掘算法在支持度发生变化时,需要对序列数据库进行重复挖掘,为减少由此产生的时空消耗,提出一种高效的增量式序列模式挖掘算法。算法采用频繁序列树作为序列存储结构,当序列数据库和最小支持度发生变化时,通过执行更新操作,实现频繁序列树的更新,利用深度优先遍历频繁序列树找到序列数据库中所有的序列模式。实验结果表明,与IncSpan算法和PrefixSpan算法相比,该算法的挖掘效率较高。 相似文献
17.
18.
基于投影数据集的序列模式增量挖掘算法 总被引:1,自引:0,他引:1
提出一种基于投影数据集的序列增量更新算法Inc_SPM,该算法以PrefixSpan算法为基础。首先利用已有的知识得出频繁1序列,然后生成投影数据集以迭代产生频繁k序列;同时为了控制投影数据集的规模,利用等价投影数据集来改进投影终止条件。 相似文献