共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
PretixSpan算法解决了类Apriori算法的不足,但产生的投影数据库花费了较多的存储空间及扫描时间.本文基于PretixSpan算法提出PSD算法,舍弃了对非频繁项的存储及对投影序列数小于最小支持数的投影数据库的扫描,减少了不必要的存储空间,提高了查询速度.实验证明,PSD算法比PretixSpan算法具有更好的时空性能. 相似文献
3.
4.
5.
传统的数据挖掘方法会生成大量的模式和规则,且难以理解,而实际上用户感兴趣的只是其中的一小部分.针对该问题,在挖掘序列模式的PrefixSpan算法基础上提出一种带数据项约束的序列模式挖掘方法,通过数据项约束,减少了搜索空间.实验结果表明,该方法可以有效地挖掘出满足数据项约束的序列模式. 相似文献
6.
针对带时间约束的序列模式,提出了一种改进的挖掘算法TSPM,克服了传统的序列模式挖掘方法时空开销大,结果数量巨大且缺少针对性的缺陷.算法引入图结构表示频繁2序列,仅需扫描一次数据库,即可将与挖掘任务相关的信息映射到图中,图结构的表示使得挖掘过程可以充分利用项目之间的次序关系,提高了频繁序列的生成效率.另外算法利用序列的位置信息计算支持度,降低了处理时间约束的复杂性,避免了反复测试序列包含的过程.实验证明,该算法较传统的序列模式发现算法在时间和空间性能上具有优越性。 相似文献
7.
8.
提出了满足滑动窗口、最大间隙、最小间隙、最大跨度四种时间参数限制的序列挖掘算法.算法通过划分不同的等价类分解搜索空间,利用时间连接实现模式的逐步增长,挖掘过程只需扫描一次序列数据库.由于序列嵌入的四种参数具有通用性,本算法不仅能发现以前相关算法所能发现的模式,还能发现其他算法所不能发现的模式。 相似文献
9.
一种基于频繁序列树的增量式序列模式挖掘算法 总被引:1,自引:0,他引:1
针对目前现有的增量式序列模式挖掘算法没有充分利用先前的挖掘结果,当数据库更新时,需要对数据库进行重复挖掘的问题。本文提出一种基于频繁序列树的增量式序列模式挖掘算法(ISFST),ISFST采用频繁序列树作为序列存储结构,当数据库发生变化时,ISFST算法分两种情况对频繁序列树进行更新操作,通过遍历频繁序列树得到满足最小支持度的所有序列模式。实验结果表明,ISFST算法在时间性能上优于PrefixSpan算法和IncSpan算法。 相似文献
10.
现有的增量式挖掘算法在支持度发生变化时,需要对序列数据库进行重复挖掘,为减少由此产生的时空消耗,提出一种高效的增量式序列模式挖掘算法。算法采用频繁序列树作为序列存储结构,当序列数据库和最小支持度发生变化时,通过执行更新操作,实现频繁序列树的更新,利用深度优先遍历频繁序列树找到序列数据库中所有的序列模式。实验结果表明,与IncSpan算法和PrefixSpan算法相比,该算法的挖掘效率较高。 相似文献
11.
12.
带时间特征的序列模式挖掘算法TESP 总被引:4,自引:0,他引:4
引入序列模式时间特征的概念,并提出了一个带时间约束的序列模式挖掘算法,称做TESP(Time-enriched Sequential Pattern mining),该算法在找出模式的同时,也给出了序列模式的时间特征,并且允许用户在挖掘之前对模式的这些时间特征进行限制,提高了序列模式挖掘的灵活性和有用性。 相似文献
13.
14.
如何有效地将约束与挖掘过程结合,将是提高基于约束的序列模式发现算法效率的关键。本文针对一种典型的强约束形式--MaxGap约束,提出了一种有效的序列模式挖掘方法。该方法利用MaxGap约束的特点,采用了高效的扩展单项剪枝策略,有效地减小了搜索空间的大小,提高了挖掘效率。实验结果表明,本文方法在性能上明显优于现有的方法。 相似文献
15.
16.
17.
18.
采用限制与多维技术的数据采掘 总被引:1,自引:0,他引:1
针对当今数据采掘中效率不够高的问题,提出了采用限制与多维技术来进行数据采掘,讨论了哪些种类的限制能运用到采掘过程中,设计了一个数据采掘系统结构。 相似文献
19.
20.
序列模式数据挖掘算法的并行化研究 总被引:1,自引:0,他引:1
序列模式在许多领域都有着重要的应用,大量的数据和模式需要高效的、可扩展的并行算法.针对目前序列模式挖掘算法存在的普遍问题,在对串行序列模式数据挖掘算法研究的基础上,本文提出了一种并行的序列模式数据挖掘算法.通过理论分析与实验验证可知:该并行数据挖掘算法,在海量数据的情形下,能很好地提高数据挖掘的效率. 相似文献