共查询到17条相似文献,搜索用时 72 毫秒
1.
时间序列相似性搜索是数据挖掘的一个重要基础性研究内容,它的相似性定义主要是基于欧氏距离,这类算法的缺点:如果时间序列产生偏移,会产生错误的结果.基于形态特征的时间序列相似性快速搜索算法,以界标为分界点,利用界标提取了时间序列的特征,将时序分为若干子序列,并对每个子序列进行线性化,将线性化后的子序列进行预处理;同样将查询序列进行基于界标的分段算法,然后利用一种改进的快速相似性搜索算法,可以快速地搜索到与查询序列相似的序列.?# 箅例表明了算法的有效性. 相似文献
2.
从应用角度对时间序列数据挖掘中的关键技术一相似性度量一进行了研究。实现了对时间序列的分段线性表示,并将其用于当前主要的几种时间序列距离度量算法。通过将各距离度量算法用于股票收盘数据分析实验,得出实验数据。通过对实验结果的分析并结合各算法的原理,对各方法的适用情况和执行效率进行了分析及比较。通过分析可知,每种算法有自己的特点及适用情况。对于实际应用,应根据实际需求选择合适的距离度量算法。 相似文献
3.
从应用角度对时间序列数据挖掘中的关键技术-相似性度量-进行了研究。实现了对时间序列的分段线性表示,并将其用于当前主要的几种时间序列距离度量算法。通过将各距离度量算法用于股票收盘数据分析实验,得出实验数据。通过对实验结果的分析并结合各算法的原理,对各方法的适用情况和执行效率进行了分析及比较。通过分析可知,每种算法有自己的特点及适用情况。对于实际应用,应根据实际需求选择合适的距离度量算法。 相似文献
4.
针对传统的数据管理中的数据表示、存储与索引、查询与挖掘等所有技术, 不能直接应用于不确定性时间序列数据的相似性查找的不足. 研究了可用于不确定性时间序列数据的降维表示、索引与剪枝、查找等理论与技术, 针对不确定性时间序列数据结构的复杂性, 首次给出了不确定性时间序列上的概率最近邻的定义; 将不确定性时间序列进行了PLA降维, 转换到PLA空间, 并提出了三个引理, 用以加速查找效率; 基于该三个引理, 提出了概率K最近邻查找算法PKNNS. 通过实验, 验证了PKNNS算法的有效性和效率. 相似文献
5.
时间序列的相似性搜索是时间序列知识发现的重要方面。该文提出了一种新的基于距离度量的时间序列相似性搜索算法。该算法采用分段线性表示,同时使用改进的模式距离来度量序列间的距离。 相似文献
6.
8.
9.
实际过程中采集到的时间序列数据通常是海量数据,在原时间序列数据上直接进行数据挖掘的效率通常是低下的,有时甚至不可行,因此就须将时间序列在更高的层次上进行表示。借鉴时间序列线性分段的基本思想,提出了一种自适应误差约束的分段线性表示方法,该方法在查找出时间序列特殊点的基础上,通过给定误差e进行调节,可以自动地产生拟合线段的数目。不仅可以压缩数据,去除噪声,还能得到时间序列的模式变化特征。与一般的分段线性表示相比,文中方法的拟合误差更小,适应能力更强。 相似文献
10.
11.
12.
时间序列的快速相似性搜索改进算法 总被引:1,自引:0,他引:1
This paper introduces a new method for finding all subsequences similar to a given time series sequence.The method takes into account noise ,offset translation and amplitude scaling. Based on a piecewise linear representa-tion, the speed is exceptionally fast. 相似文献
13.
该文提出了基于傅立叶变换的一种新的时间序列相似搜索算法。该算法利用高效的索引方法,达到快速的匹配,解决了多序列的子序列匹配问题。大量算例验证了该算法的通用性和有效性,它可以应用到求解各种时间序列相关的实际问题。 相似文献
14.
Dimensionality Reduction for Fast Similarity Search in Large Time Series Databases 总被引:36,自引:3,他引:33
Eamonn Keogh Kaushik Chakrabarti Michael Pazzani Sharad Mehrotra 《Knowledge and Information Systems》2001,3(3):263-286
The problem of similarity search in large time series databases has attracted much attention recently. It is a non-trivial
problem because of the inherent high dimensionality of the data. The most promising solutions involve first performing dimensionality
reduction on the data, and then indexing the reduced data with a spatial access method. Three major dimensionality reduction
techniques have been proposed: Singular Value Decomposition (SVD), the Discrete Fourier transform (DFT), and more recently
the Discrete Wavelet Transform (DWT). In this work we introduce a new dimensionality reduction technique which we call Piecewise
Aggregate Approximation (PAA). We theoretically and empirically compare it to the other techniques and demonstrate its superiority.
In addition to being competitive with or faster than the other methods, our approach has numerous other advantages. It is
simple to understand and to implement, it allows more flexible distance measures, including weighted Euclidean queries, and
the index can be built in linear time.
Received 16 May 2000 / Revised 18 December 2000 / Accepted in revised form 2 January 2001 相似文献
15.
16.
提前终止(Early Abandon)是在受限的相似搜索中的一项技术,在提高时间序列相似搜索的效率,减少冗余计算中取得成功应用.但是以往的工作中提前终止的效率往往都只是通过大量的实验测试来体现,而缺少一种理论化的方法.从理论上提出了一种对提前终止技术的实际效率的估算方法,采用统计概率的方式分析了提前终止技术在时间序列相似搜索中的效率,同时对理论结果进行了实验验证.实验结果表明,理论上的估计方法在一定程度上可以估算出提前终止的效率,为时间序列相似搜索的实际效率计算提供了理论工具. 相似文献
17.
针对动态时间弯曲方法计算时间过长的问题,提出增量动态时间弯曲来度量较长时间序列之间的相似性。首先利用动态时间弯曲方法对历史时间序列数据进行相似性度量,得到相应的历史最优弯曲路径和路径中各元素的累积距离代价。其次,通过逆向弯曲度量方法完成当前序列数据 的相似性度量,结合历史数据信息找到与历史弯曲路径相交且度量时间序列距离为当前最小值的新路径,进而实现增量动态时间弯曲的相似性度量。该方法不仅具有良好的度量质量,还具有较高的时间效率。数值实验表明,对于大部分时间序列数据集,新方法的分类准确率和计算性能要优于经典动态时间弯曲。 相似文献