首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
针对时间序列模体发现算法计算复杂,并且无法发现多实例模体的问题,提出基于子序列全连接和最大团的时间序列模体发现(TSSJMC)算法。首先,使用快速时间序列子序列全连接算法求得所有子序列之间的距离,生成距离矩阵;然后,设置相似性阈值,将距离矩阵转化为邻接矩阵,构造子序列相似图;最后采用最大团搜索算法从相似图中搜索最大团,最大团的顶点对应的时间序列为包含最多实例的模体。在公开的时间序列数据集上进行实验,选用已有的能够发现多实例模体的Brute Force和Random Projection算法作为对比对象,分别从准确性、效率、可扩展性和鲁棒性对TSSJMC算法进行分析并获得了客观的评判结果。实验结果表明,与Random Projection算法相比,TSSJMC算法在效率、可扩展性和鲁棒性法方面均有明显优势;与Brute Force算法相比,TSSJMC算法发现的模体实例数量虽略低,但其效率和可扩展性都优于Brute Force算法。因此,TSSJMC是质量和效率相平衡的算法。  相似文献   

2.
基于时间序列的相似子模式发现算法   总被引:4,自引:0,他引:4  
基于时问序列的数据挖掘时,一般需要对时间序列离散化,再聚类成不同的子模式。已有的方法常忽略时间序列本身的位置和整体特征,并且计算量大。针对其不足,文中提出一种检索时间序列分段关键点的算法,以关键点为边界分段,使用形态距离测度和快速剪除的算法,高效简便地检索出相似子模式。  相似文献   

3.
张军  马志民 《微机发展》2006,16(1):140-142
基于时间序列的数据挖掘时,一般需要对时间序列离散化,再聚类成不同的子模式。已有的方法常忽略时间序列本身的位置和整体特征,并且计算量大。针对其不足,文中提出一种检索时间序列分段关键点的算法,以关键点为边界分段,使用形态距离测度和快速剪除的算法,高效简便地检索出相似子模式。  相似文献   

4.
数据流技术在金融分析、网络监控等诸多领域得到了广泛应用,而已有的子序列匹配算法主要针对静态序列,难于直接应用到海量、高速和连续的流数据。本文在动态时间规整技术的基础上,提出了一种新颖的TopKSM算法,能渐进、实时地获取Top-K相似子序列。算法完全符合数据流"单遍扫描"的性能要求。大量的实验表明,与现有的SPRING算法相比,该算法具有更高的性能。  相似文献   

5.
基于符号化表示的时间序列频繁子序列挖掘   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种新的基于符号化表示的时间序列频繁子序列的挖掘算法。利用基于PAA的分段线性表示法进行降维,通过在高斯分布下设置断点,实现时间序列符号化表示,利用投影数据库挖掘频繁子序列。该算法简单、新颖,运行快速,简化了子序列支持数的计算。  相似文献   

6.
邹蕾  高学东 《计算机应用》2016,36(9):2472-2474
时间序列子序列匹配作为时间序列检索、聚类、分类、异常监测等挖掘任务的基础被广泛研究。但传统的时间序列子序列匹配都是对精确相同或近似相同的模式进行匹配,为此定义了一种全新的具有相似发展趋势的序列模式——时间序列同构关系,经过数学推导给出了时间序列同构关系判定的法则,并基于此提出了同构关系时间序列片段发现的算法。该算法首先对原始时间序列进行预处理,然后分段拟合后对各时间序列分段进行同构关系判定。针对现实背景数据难以满足理论约束的问题,通过定义一个同构关系容忍度参数使实际时间序列数据的同构关系挖掘成为可能。实验结果表明,该算法能有效挖掘出满足同构关系的时间序列片段。  相似文献   

7.
汤春蕾  董家麒 《计算机学报》2012,35(11):2228-2236
子序列的相似性查询是时间序列数据集中的一种重要操作,包括范围查询和k近邻查询.现有的大多算法是基于欧几里德距离或者DTW距离的,缺点在于查询效率低下.文中提出了一种新的基于LSH的距离度量方法,可以在保证查询结果质量的前提下,极大提高相似性查询的效率;在此基础上,给出一种DS-Index索引结构,利用距离下界进行剪枝,进而还提出了两种优化的OLSH-Range和OLSH-kNN算法.实验是在真实的股票序列集上进行的,数据结果表明算法能快速精确地找出相似性查询结果.  相似文献   

8.
索引空间相似性度量标准的精确度较低,在现有的相似时间子序列搜索算法中,后期处理过程中内外存之间数据的I/O时间较长。针对该问题,引用一种非线性维数约简技术,提出改进的相似时间子序列快速搜索算法,提高索引空间相似性度量标准的精确度,降低错误匹配的发生率。实验结果表明,该算法可有效降低重复估算的数据量,提高相似性搜索的效率。  相似文献   

9.
动态时间弯曲算法虽然适合度量时间序列的相似度,但是在大数据背景下,对于序列个数多、潜在长度可能是无穷、实时性要求高的流式时间序列,面临着算法简单、计算不简单的可计算问题。以Spark计算平台为基础,针对流式时间序列的特点,提出了一种流式动态时间弯曲算法,能实时计算动态时间序列近似值,误差可控、稳定,且具备大数据计算能力。最后通过实验验证了算法的可行性和稳定性。  相似文献   

10.
基于小波的时间序列流伪周期检测方法   总被引:1,自引:0,他引:1  
李晓光  宋宝燕  于戈  王大玲 《软件学报》2010,21(9):2161-2172
提出一种有效的时间序列流伪周期检测方法MPD(memory-constrain period detection).它采用Haar小波技术构建时间序列流大纲,利用部分片段估计周期方法提高检测效率,采用基于三次插值的周期估计方法检测任意长度的周期.通过对MPD误差的理论分析和实验分析,验证了MPD的时间和空间复杂度以及检测误差的有效性.  相似文献   

11.
针对噪声数据对时间序列异常检测准确性的影响问题, 提出了一种不确定连续时间序列Top-K异常检测算法。在典型时间序列异常检测方法的基础上对时间序列的异常值进行区间处理, 构造满足均匀分布的密度函数, 结合不确定Top-K技术, 实现含噪连续时间序列在分布未知情况下的Top-K异常排序。实验部分采用模拟数据和真实数据进行算法测试, 算法较传统方法在异常检测的准确率方面有明显提高, 虽然在计算时间上有所增加, 但提出了相应的优化策略, 使计算时间在k值大于5时有明显改善, 验证了算法的有效性。  相似文献   

12.
针对目前已有的时间序列数据分段方法多侧重于静态数据的分段现状,根据时间序列流数据的变化情况,分析数据流的状态,提出一种有限自动机的分段方法,它通过分析时间序列流中数据所处的状态,进而发现其中的变化点,并以变化点作为段的两端,从而完成时间序列的分段。实验表明,这种方法能够有效地对高速时间序列流进行分段,保证了分段的效果和质量。  相似文献   

13.
The data stream processing framework processes the stream data based on event-time to ensure that the request can be responded to in real-time. In reality, streaming data usually arrives out-of-order due to factors such as network delay. The data stream processing framework commonly adopts the watermark mechanism to address the data disorderedness. Watermark is a special kind of data inserted into the data stream with a timestamp, which helps the framework to decide whether the data received is late and thus be discarded. Traditional watermark generation strategies are periodic; they cannot dynamically adjust the watermark distribution to balance the responsiveness and accuracy. This paper proposes an adaptive watermark generation mechanism based on the time series prediction model to address the above limitation. This mechanism dynamically adjusts the frequency and timing of watermark distribution using the disordered data ratio and other lateness properties of the data stream to improve the system responsiveness while ensuring acceptable result accuracy. We implement the proposed mechanism on top of Flink and evaluate it with realworld datasets. The experiment results show that our mechanism is superior to the existing watermark distribution strategies in terms of both system responsiveness and result accuracy.  相似文献   

14.
在研究已有时间序列数据流预测方法的前提下,给出了一种基于滑动窗口的时间序列数据流通用预测模型,提出能有效降噪并进行多尺度滑动窗口分析,进而进行预测的新方法Online-HHT,将数据流中的滑动窗口技术与HHT方法相结合从而达到在线分析的目的。使用此模型,通过实验证实了Online-HHT方法能够有效地对时序数据流进行在线自适应趋势预测。  相似文献   

15.
在时间序列的GMBR表示的基础上,首次提出将基于距离和基于密度的时间序列检测方法结合,给出了时间序列模式异常的定义,并用“异常特征值”来衡量时间序列模式的异常程度.根据所提出的模式异常的定义,在强力搜索算法的基础之上提出了新的时间序列异常检测算法GMBR-DD (Grid Minimum Bounding Rectangle-Discords Detect),该算法将基于距离和基于密度的异常检测方法结合,能够高效地发现时间序列中的异常模式.通过三组实验数据,对提出的异常时间序列定义和时间序列的异常检测算法进行了验证,实验结果表明所提出的时间序列异常检测算法能够有效地发现时间序列的异常变动,为决策提供了很好的平台和有力的工具.  相似文献   

16.
针对SPRING提出的使用精确DTW距离造成弯曲矩阵中有许多无用的计算数据格的不足,提出一种受限的动态时间弯曲距离CSDTW。通过限制某时刻弯曲路径的弯曲程度,同时结合DTW上的提前终止算法,以减少无用数据格的出现。实验对比表明,CSDTW能够避免大量冗余数据格的计算,加快流环境下精确DTW处理的效率。  相似文献   

17.
现实中的时序数据,往往取自于复杂系统,表现出长记忆效应与短时不规则波动同时并存。传统的时序数据的分析和预测方法一般对不同层次的影响不加以区分,而是为其建立一个统一的模型,这使得在对复杂系统建模时需要用大量的参数予以表征,影响预测效率与精度。为此采用新的方法,将序列数据本身进行多平滑因子分解,对分解后的序列进行多尺度的采样并分别建模、预测,最后将结果整合。该方法应用于股票的实验表明,即使对起伏波动很大的时间序列,也能够得到较好的预测结果。  相似文献   

18.
为了更好地体现时间序列的形态特征,并探索更适合于较长时间序列之间相似性度量的方法,在动态时间弯曲算法的基础上进行改进,提出了基于分层动态时间弯曲的序列相似性度量方法。对时间序列进行多层次分段,并从分段中均匀抽取相对应的层次分段子序列,然后将层次分段子序列抽象为三维空间的点(反映了分段子序列的均值、长度和趋势)进行相似性度量,最后综合各个层次的相似性度量作为结果。实验表明,在参数设置合理的情况下,此方法能获得较高的序列相似性度量准确度和效率。  相似文献   

19.
时间序列数据流中蕴含了大量潜在信息,可以作为智能决策的依据。研究时间序列数据流的变化趋势,预测其未来一段时间的可能值,能够为当前的决策提供重要的支持。提出用链式可重写窗口技术代替传统的滑动窗口技术,并结合经验模式分解和径向基神经网络建立时间序列数据流在线预测模型——Online_DSPM。实验结果表明,与单一时间序列数据流预测模型相比,该模型具有较高的预测精度和校好的模型适应性。  相似文献   

20.
A periodic time series analysis is explored in the context of unobserved components time series models that include stochastic time functions for trend, seasonal and irregular effects. Periodic time series models allow dynamic characteristics (autocovariances) to depend on the period of the year, month, week or day. In the standard multivariate approach one can interpret a periodic time series analysis as a simultaneous treatment of typically yearly time series where each series is related to a particular season. Here, the periodic analysis applies to a vector of monthly time series related to each day of the month. Particular focus is on the forecasting performance and therefore on the underlying periodic forecast function, defined by the in-sample observation weights for producing (multi-step) forecasts. These weight patterns facilitate the interpretation of periodic model extensions. A statistical state space approach is used to estimate the model and allows for irregularly spaced observations in daily time series. Recent algorithms are adopted for the computation of observation weights for forecasting based on state space models with regressor variables. The methodology is illustrated for daily Dutch tax revenues that appear to have periodic dynamic properties. The dimension of our periodic unobserved components model is relatively large as we allow each element (day) of the vector of monthly time series to have a changing seasonal pattern. Nevertheless, even with only five years of data we find that the increased periodic flexibility can help in out-of-sample forecasting for two extra years of data.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号