首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
时间序列的相似性度量是时间序列分析的基础工作之一,是进行相似匹配的关键。针对欧几里德距离描述分段趋势的不足和各种模式距离对应分段之间距离值的离散化问题,提出一种基于形态相似距离的时间序列相似性度量方法,标准数据集上完成的识别和聚类实验表明了该方法的可行性和有效性。  相似文献   

2.
利用反馈的时序模式挖掘算法研究   总被引:2,自引:0,他引:2  
针对时序数据相似性挖掘方法进行研究,提出一种利用反馈的时序数据相似性挖掘算法,由用户赋予各初始范围查询得到的相似序列相应的权值,通过反馈与给定序列叠加产生新的查询序列,再次进行范围查询,获得相似序列,将该算法用于某钢铁企业的电力负荷时序数据,计算结果表明了算法的有效性。  相似文献   

3.
时间序列数据挖掘的相似性度量综述   总被引:1,自引:0,他引:1  
在时间序列数据挖掘中, 时间序列相似性是一个重要的概念. 对于诸多算法而言, 能否与一种合适的相似性度量方法结合应用, 对其挖掘性能有着关键影响. 然而, 至今仍没有统一的度量相似性的方法. 对此, 首先综述了常用的相似性度量方法, 分析了各自的优点与不足; 其次, 讨论了近年来出现的时序相似性的新解释及其度量方法; 再次, 探讨了相似性度量在时序挖掘任务中的应用以及与挖掘精度的关系; 最后给出了关于时序相似性度量进一步的研究方向.  相似文献   

4.
为了减少噪声数据对查询最优序列的影响,避免Euclidean距离对形态的敏感性,以及要求序列等长的缺点,提出了面向噪声数据的时间序列相似性搜索算法.运用SPC方法去除序列中的噪声数据;采用DTW距离作为度量函数,使用规范化方法使序列处于相同的分辨率下;采用LB_ Keogh下界函数对候选序列集合进行筛选.仿真实验结果表明,该算法在阈值较小时,对含有噪声数据序列的匹配能力较强.  相似文献   

5.
时间序列相似性度量在挖掘时间序列模式,提取时间序列关联关系上发挥着重要作用。分析了当前主流的时间序列相似性度量算法,分别指出了各度量算法在度量时序数据相似性时存在的缺陷,并提出了基于数学形态学的时间序列相似性度量算法。通过将归一化的时间序列二值图像化表示,再引入了图像处理领域中的膨胀、腐蚀操作对时序数据进行形态变换分析,提高相似时序数据部分的抗噪性,同时又不降低时序数据非相似部分间的差异度,实现时序数据相似性度量分类精度的提高。在八种时间序列测试数据集合上进行分类实验,实验结果表明提出的基于数学形态学的时间序列相似性度量算法在时间序列分类精度上得到有效改善,相比于DTW相似性度量算法,分类精度平均水平提升了8.74%,最高提升20%。  相似文献   

6.
符号化表示是一种有效的时间序列降维技术,其相似性度量是诸多挖掘任务的基础。基于SAX(sym-bolic aggregate approximation)的距离MINDIST_PAA_iSAX不满足对称性,在时间序列挖掘中具有局限性,提出了对称的度量Sym_PAA_SAX,且下界于欧拉距离。在真实数据集和合成数据集上的实验说明下界紧密性较好,相似搜索错报率较低。  相似文献   

7.
郭小芳  李锋 《计算机工程与应用》2012,48(23):111-114,119
为提高多元时间序列相似性度量的效率,采用扩展Frobenius范数(Eros)的主元分析(PCA)方法,通过主元和本征值构造主元相似因子,用于比较多元时间序列矩阵之间的相似性。为了验证这种方法的有效性,针对三组数据(两个真实数据,一个合成数据)进行了实验。结果表明,该方法相对于以往的欧几里德距离(ED),动态时间弯曲(DTW)相似性度量方法具有一定的优越性。  相似文献   

8.
针对无线传感网中节点故障率高而导致检测精度低以及能耗大的问题,提出了基于时间序列相似度的无线传感网故障检测算法(FDABTS2).该算法利用节点时间序列进行差值和相似度的计算,剔除一定故障类型的节点,并对瞬时读数故障数据进行修正.当节点为可疑节点时,利用空间相关性,与剩余邻居节点协作完成判定.在仿真环境下,与LEFD、NADST以及传统的DFD故障检测算法相比,检测精度分别提高了13%、17%和25%,误报率分别降低了8.4%、21.4%和25.4%,网络能耗分别降低了2.9%、8%和21.3%,即使在瞬时读数节点故障率高达60%时,误报率也能分别降低1.9%、26.2%和38.2%.实验结果表明,该算法在保证高检测精度的情况下,仍能有效降低能耗,延长网络生命周期.  相似文献   

9.
Hierarchical image segmentation based on similarity of NDVI time series   总被引:1,自引:0,他引:1  
Although a variety of hierarchical image segmentation procedures for remote sensing imagery have been published, none of them specifically integrates remote sensing time series in spatial or hierarchical segmentation concepts. However, this integration is important for the analysis of ecosystems which are hierarchical in nature, with different ecological processes occurring at different spatial and temporal scales. Therefore, the objective of this paper is to introduce a multi-temporal hierarchical image segmentation (MTHIS) methodology to generate a hierarchical set of segments based on spatial similarity of remote sensing time series. MTHIS employs the similarity of the fast Fourier transform (FFT) components of multi-seasonal time series to group pixels with similar temporal behavior into hierarchical segments at different scales. Use of the FFT allows the distinction between noise and vegetation related signals and increases the computational efficiency. The MTHIS methodology is demonstrated on the area of South Africa in an MTHIS protocol for Normalized Difference Vegetation Index (NDVI) time series. Firstly, the FFT components that express the major spatio-temporal variation in the NDVI time series, the average and annual term, are selected and the segmentation is performed based on these components. Secondly, the results are visualized by means of a boundary stability image that confirms the accuracy of the algorithm to spatially group pixels at different scale levels. Finally, the segmentation optimum is determined based on discrepancy measures which illustrate the correspondence of the applied MTHIS output with landcover-landuse maps describing the actual vegetation. In future research, MTHIS can be used to analyze the spatial and hierarchical structure of any type of remote sensing time series and their relation to ecosystem processes.  相似文献   

10.
时间序列形态相似性挖掘是目前时间序列数据挖掘研究的热点,然而由于时间序列数据背后真实系统的复杂性,加上观测条件的影响,时间序列会呈现多种相似性变形,如振幅伸缩、振幅漂移、线性漂移等。相似性变形并不会改变序列的形态特征,但现有的ED、DTW和Lp距离等相似性度量算法均不能有效支持识别各类相似性变形。本文首次提出涨落模式(FP)的概念,以涨落模式保存原序列的趋势变化信息,利用最长公共子序列算法计算涨落模式的相似度,消除振幅伸缩、振幅漂移和线性漂移等对相似性挖掘带来的影响,实现基于涨落模式的时间序列相似性度量。设置仿真数据集检验FP相似性度量的相似性变形支持性,同时在真实数据集上进行分类,依据分类准确性对算法鲁棒性进行评估,验证了本文提出的基于涨落模式的相似性度量算法在各类相似性形变上的有效支持性。  相似文献   

11.
林炀  江育娥  林劼 《计算机应用》2016,36(12):3285-3291
基于动态时间规整算法思想的CrossMatch算法可以用来解决序列间的部分相似问题,但是由于算法时间空间复杂度过高,需要消耗大量的计算资源,因此无法应用于长序列之间的计算。针对以上问题,提出了一个基于分布式平台上的时间序列局部相似性检测算法。将CrossMatch算法实现在了分布式框架上,解决了计算资源不足的问题。首先需要对序列进行切分,分别放置在不同的节点上;其次,各节点分别处理各自序列的相似部分;最后,通过对结果进行汇总并拼接,找出序列间的局部相似。实验结果表明,该算法在准确性上和CrossMatch相近,在时间上也有提升。改进后的分布式算法不仅解决了单机无法处理的长序列计算问题,而且可以通过增加并行计算节点数提高运行速度。  相似文献   

12.
基于时间序列相似性聚类的应用研究综述   总被引:3,自引:1,他引:3  
在综合分析近年来时间序列数据挖掘相关文献的基础上从时间序列分割、相似性度量、时间序列聚类等方面对时间序列数据挖掘进行了综述,简要分析了基于时间序列相似性聚类的研究现状,对比较流行的算法进行了比较分析,对当前一些未解决的问题进行了简要介绍,并在此基础上对未来的发展趋势进行了展望,为研究者了解最新的基于时间序列相似性聚类研究动态、新技术及发展趋势提供了参考.  相似文献   

13.
This paper introduces a shape-based similarity measure, called the angular metric for shape similarity (AMSS), for time series data. Unlike most similarity or dissimilarity measures, AMSS is based not on individual data points of a time series but on vectors equivalently representing it. AMSS treats a time series as a vector sequence to focus on the shape of the data and compares data shapes by employing a variant of cosine similarity. AMSS is, by design, expected to be robust to time and amplitude shifting and scaling, but sensitive to short-term oscillations. To deal with the potential drawback, ensemble learning is adopted, which integrates data smoothing when AMSS is used for classification. Evaluative experiments reveal distinct properties of AMSS and its effectiveness when applied in the ensemble framework as compared to existing measures.  相似文献   

14.
The present work addresses the problem of missing data in multidimensional time series such as those collected during operational transients in industrial plants. We propose a novel method for missing data reconstruction based on three main steps: (1) computing a fuzzy similarity measure between a segment of the time series containing the missing data and segments of reference time series; (2) assigning a weight to each reference segment; (3) reconstructing the missing values as a weighted average of the reference segments. The performance of the proposed method is compared with that of an Auto Associative Kernel Regression (AAKR) method on an artificial case study and a real industrial application regarding shut-down transients of a Nuclear Power Plant (NPP) turbine.  相似文献   

15.
Recently, the increasing use of time series data has initiated various research and development attempts in the field of data and knowledge management. Time series data is characterized as large in data size, high dimensionality and update continuously. Moreover, the time series data is always considered as a whole instead of individual numerical fields. Indeed, a large set of time series data is from stock market. Stock time series has its own characteristics over other time series. Moreover, dimensionality reduction is an essential step before many time series analysis and mining tasks. For these reasons, research is prompted to augment existing technologies and build new representation to manage financial time series data. In this paper, financial time series is represented according to the importance of the data points. With the concept of data point importance, a tree data structure, which supports incremental updating, is proposed to represent the time series and an access method for retrieving the time series data point from the tree, which is according to their order of importance, is introduced. This technique is capable to present the time series in different levels of detail and facilitate multi-resolution dimensionality reduction of the time series data. In this paper, different data point importance evaluation methods, a new updating method and two dimensionality reduction approaches are proposed and evaluated by a series of experiments. Finally, the application of the proposed representation on mobile environment is demonstrated.  相似文献   

16.
基于螺旋图的时间序列数据可视化   总被引:1,自引:0,他引:1  
阶段性时间序列数据是一种生活中常见数据形式,它描述一个包含多个状态转换的事件,每个状态都具有时间属性,且状态之间的转换存在多条路径。针对现有的可视化方法不能有效展示各个状态之间变化以及状态间路径的时间属性信息的问题,提出一个全新的基于螺旋图的可视化模型。该模型使用一个圆环表示一个状态,一个事件的多个状态采用一组同心圆表示,状态间可达路径采用螺旋线表示,螺旋线的起始位置由其起始时间与起始状态圆环决定,终止位置由其结束时间与结束状态圆环决定。针对路径过多导致路径覆盖较为严重的问题,该模型采用基于长尾函数的透明算法,根据一条路径与其他路径的交叉数,为每条路径分配透明度。该模型还提供了路径的筛选、高亮、查看详细信息、缩放等功能,实现了灵活的交互操作。通过对中国铁路列车站点数据进行实验,实验结果表明该模型能够在有限的空间中有效地展示站点间运行任意时长的列车,并且在列车较多的情况下降低了螺旋线交叉重叠带来的杂乱度,同时有效地保留了列车的运行信息,能够为用户路线的选择提供决策支持,说明了该模型对阶段性时间序列数据可视化的有效性。  相似文献   

17.
为了弥补保序加密算法的隐私泄漏问题,结合对称可搜索加密技术基本思想,提出一种新型的具有隐私保护功能的范围数据加密查询算法.在该算法中,将数字范围转换为特殊关键字并放入布隆过滤器进行存储与命中判定,其中密文信息仅与值域相关,与具体数据无关,从而保证了语义安全性.实验结果表明,该算法计算负载仅为线性增长.综合而言,该算法具有更高的安全性与良好的运行效率.  相似文献   

18.
刘芬  郭躬德 《计算机应用》2013,33(1):192-198
基于关键点的符号化聚合近似(SAX)改进算法(KP_SAX)在SAX的基础上利用关键点对时间序列进行点距离度量,能更有效地计算时间序列的相似性,但对时间序列的模式信息体现不足,仍不能合理地度量时间序列的相似性。针对SAX与KP_SAX存在的缺陷,提出了一种基于SAX的时间序列相似性复合度量方法。综合了点距离和模式距离两种度量,先利用关键点将分段累积近似(PAA)法平均分段进一步细分成各个子分段;再用一个包含此两种距离信息的三元组表示每个子分段;最后利用定义的复合距离度量公式计算时间序列间的相似性,计算结果能更有效地反映时间序列间的差异。实验结果显示,改进方法的时间效率比KP_SAX算法仅降低了0.96%,而在时间序列区分度性能上优于KP_SAX算法和SAX算法。  相似文献   

19.
王军  王正路  程勇 《计算机应用》2014,34(10):2766-2770
由于温度、光照等物理属性的时空连续性,密集部署的传感器网络中节点感知的数据往往具有很高的时空相关性。这种数据相关性产生的数据冗余会带来通信负担,也会缩短网络的生命周期。提出一种基于预测模型的簇型数据收集机制 (CDCF),探索数据相关性,减少无线传感器网络的通信量。该机制包括一种基于曲线拟合最小二乘法的时间序列预测模型和简单有效的误差控制方法。在数据收集过程中,簇型结构考虑到了数据间的空间相关性,时间序列预测模型探讨数据的时间相关性。实验仿真表明,在较为稳定的网络环境中,相对于收集原始数据,该机制只需10%~20%的通信量就可完成整个网络的数据收集任务;数据误差控制方法可以确保基站恢复数据的误差控制在用户定义的误差范围之内。  相似文献   

20.
提出一种通用的时间序列数据流预测方法,算法首先通过经验模式分解方法将从链式重写窗口取得的数据集分解有限具有特征振荡周期的固有模态函数分量和一个代表原始序列平均趋势的余量;然后对于各个分量分别建立最大Lyapunov指数预测模型进行预测;最后将各分量的预测值组合获得最终预测值。通过电力负荷的预测实验表明,与单一的时间序列数据流预测模型相比,该模型具有较高的预测精度和很好的模型适应性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号