首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 515 毫秒
1.
时间序列具有数据量大、维数高和更新速度快等特点,导致一般的分段线性方法难以刻画原始时间序列的全局趋势特征。针对时间序列的特性,提出了一种基于时态边缘算子的自主分段表示方法(简称APLR_TEO),能够有效刻画出时间序列的形状特征。首先通过时态边缘算子与原始时间序列做卷积并根据关联规则得到边缘极值点;然后根据时序的变化特征,采用趋势转折距离的关联规则进行自主线性分段得到关键点,进而用关键点组成的序列来线性近似表示原始时间序列。实验结果表明,APLR_TEO能够有效地刻画序列的形状特征,针对不同规模的数据集具有良好的适应性和稳定性,有效降低了拟合误差。  相似文献   

2.
基于插值边缘算子的时间序列模式表示   总被引:1,自引:0,他引:1  
借鉴数字图像领域中边缘算子的基本思想,提出一种基于插值边缘算子的时间序列分段线性表示方法(简称为IEO表示).该方法根据插值边缘算子中的两个子度量:边缘强度和插值误差相结合的度量标准来选取时间序列模式表示中每个子模式的边缘点(端点).时间序列的IEO表示不但可以压缩数据,还可以有效抑制噪声的影响,因而具有较强的适应性,可以适应不同的数据特征环境.  相似文献   

3.
通过计算某一点与其左右两相邻点斜率的比值确定出变化点,连接这些变化点,就得到一种基于斜率变化阈值的时间序列分段线性STC表示算法。来自航天器不同分系统的真实数据集实验表明,使用STC算法作为航天器测试时间序列的模式表示方法,与其他分段线性表示算法相比,该方法具有算法简单、拟合程度高和适应能力强的特点。  相似文献   

4.
基于斜率提取边缘点的时间序列分段线性表示方法   总被引:7,自引:0,他引:7  
本文引入解析几何中的斜率,提出了一种新颖的基于斜率提取边缘点的时间序列分段线性表示方法SEEP。对于斜率变化范围比较集中的时间序列,SEEP表示方法有着非常好的效果,与以往的分段线性表示方法相比,SEEP表示方法与原始时间序列之间的拟合误差更小,而且要小很多;对于斜率变化范围比较大的时间序列,SEEP表示方法与原始时间序列之间的拟合误差,和以往的分段线性表示方法相比,也相差不大,并且SEEP表示方法计算简单,易于实现。算法的时间复杂度仅为O(n),  相似文献   

5.
时间序列的有监督异常检测方法通常依赖于数据的标签,不仅会消耗大量时间进行数据标注,而且难以适用于无法给定标签的数据集。为解决异常序列检测中的标注问题,提出一种采用分段特征表示的异常序列检测方法。该方法采用分段聚合思想对时间序列进行标准化计算,并得到时序数据的特征表示,可提高无标签时间序列异常检测的可靠性。将表示后的特征划分为异常序列相关特征和无关特征,剪枝异常序列无关特征,可减少这些特征对检测结果的不利影响。为有效量化不同序列之间的差异性,提出一种面向时间权重分析的时间序列相似性度量方法,并构建时间序列的相似度矩阵,用于计算序列之间的相似度,可适用于无标签的时间序列中。在此基础上,根据相似度矩阵来计算每个子序列的异常分数,将其用于异常子序列的判定。通过合成数据集和真实数据集的实验对比表明:该方法节省了计算开销,提高了算法运行的时间效率和异常序列检测的准确率。  相似文献   

6.
在分析边缘算子的思想和现有时间序列模式表示方法基础上,将边缘点方法和重要点方法相结合,提出了基于重要边缘点的时间序列模式表示算法。算法按各观测点的边缘化程度,提取重要的边缘点将时间序列分成多个子线段,通过分析直线段之间的相似性,发现异常的序列模式。从理论和实验两方面对算法进行了分析和验证,结果表明,算法复杂度较低,模式表示误差小,能够满足大规模时间序列数据模式表示的要求。  相似文献   

7.
基于分段线性动态时间弯曲的时间序列聚类算法研究   总被引:4,自引:0,他引:4  
时间序列是一类重要的复杂类型数据,时间序列知识发现正成为知识发现的研究热点之一。欧几里德距离及其扩展作为相似测度被广泛应用于时间序列的比较中,但是这种距离测度时数据没有好的鲁棒性。动态时间弯曲技术是基于非线性动态编程的一种模式匹配算法,但是其计算复杂性相当高。本文提出了基于时间序列分段线性表示的动态时间弯曲算法,通过计算线性分段序列数据之间的最短弯曲路径来获得序列的匹配。对综合控制时间序列数据进行基于不同距离测度的聚类分析对比结果表明本文提出的算法有很高的精度和时振幅差异、嘈声和线性漂移有强的鲁棒性,大大降低计算复杂性,具有良好的应用价值。  相似文献   

8.
时间序列的特征表示与相似性度量是时间序列数据挖掘的重要基础。针对现有的序列表示方法难以具体反映序列的形态变化趋势,导致相似度量结果不精确的问题,提出一种新的基于形态模式的相似性度量算法。该算法在分段线性表示的基础上,根据序列在不同时段的斜率变化情况,划分序列的分段形态模式并用特殊的字符进行表示,把时间序列转换成字符串序列,利用最长公共子序列方法计算字符串序列的距离作为时间序列之间的距离。最后通过实验验证该方法的有效性。理论分析和实验证明该方法对数据点的值不敏感,能够减少噪声的干扰,而且具有较高的准确性。  相似文献   

9.
时间序列数据的分段线性表示   总被引:2,自引:0,他引:2  
在时间序列分段线性表示(PLR)基础上,提出一种新的基于特征点的分段方法,克服采用单一误差算法的模型失配问题,更加准确地反映过程状态的变化.  相似文献   

10.
分段线性表示是时间序列降维的有效方法。在总结分析序列趋势变化特点的基础上,提出了一种基于趋势转折点的时间序列分段线性表示算法。首先定义了趋势转折点作为时间序列分段点的备选集,以点到区域的距离度量趋势转折点的重要性,再根据给定的阈值选择重要趋势转折点作为分段点,对时间序列进行分段线性表示。通过与其他6种方法进行实验比较,结果表明:所提方法在具有较好的拟合质量和适应能力以及对转折点明显的序列,都表现出较强的抗噪声干扰能力。  相似文献   

11.
一种基于信息熵的时间序列分段线性表示方法   总被引:1,自引:0,他引:1  
针对部分时间序列具有高维、大数据量及数据更新速度较快的特点, 导致在原始时间序列上难以进行数据挖掘的问题, 提出一种基于信息熵的时间序列分段线性表示方法——PLR_IE。该算法利用信息熵作为评判重要点数量的性能指标, 从序列中提取重要分段点的数量分布情况, 利用重要点组成的序列重新拟合原始时间序列, 为下一步数据挖掘提供基础。实验结果表明, 该方法能高效地提取出序列主要特征、拟合原始序列。  相似文献   

12.
实际过程中采集到的时间序列数据通常是海量数据,在原时间序列数据上直接进行数据挖掘的效率通常是低下的,有时甚至不可行,因此就须将时间序列在更高的层次上进行表示。借鉴时间序列线性分段的基本思想,提出了一种自适应误差约束的分段线性表示方法,该方法在查找出时间序列特殊点的基础上,通过给定误差e进行调节,可以自动地产生拟合线段的数目。不仅可以压缩数据,去除噪声,还能得到时间序列的模式变化特征。与一般的分段线性表示相比,文中方法的拟合误差更小,适应能力更强。  相似文献   

13.
从应用角度对时间序列数据挖掘中的关键技术一相似性度量一进行了研究。实现了对时间序列的分段线性表示,并将其用于当前主要的几种时间序列距离度量算法。通过将各距离度量算法用于股票收盘数据分析实验,得出实验数据。通过对实验结果的分析并结合各算法的原理,对各方法的适用情况和执行效率进行了分析及比较。通过分析可知,每种算法有自己的特点及适用情况。对于实际应用,应根据实际需求选择合适的距离度量算法。  相似文献   

14.
指出直接采用原始瓦斯浓度时间序列进行短期浓度预测、相似性查询、时间序列分类和聚类等数据挖掘工作不但效率低下,而且会影响时间序列数据挖掘的准确性和可靠性;提出了一种采用分段线性方法的时间序列模式表示方法。采用分段线性表示方法对瓦斯浓度时间序列进行模式表示后可换来较小的存储和计算代价,只保留了时间序列的主要形态,去除了细节干扰,更能反映出时间序列的自身特征,有利于提高数据挖掘的效率和准确性。  相似文献   

15.
分段线性表示是时间序列降维的有效方法,其关键在于分割点的确定。在时间序列分段线性表示的基础上,提出一种新的基于重要点的时间序列分割方法。与一般方法比较相邻三点关系不同的是,将时间窗扩展为前一重要点、待考察点和一个指定时间窗组成的区间,再通过比较数据点前后模式变化来确定重要点。通过与其他7种分割方法进行实验比较,证明该方法适应能力强,不但分割结果总体质量高,在压缩率相同时具有更小的拟合误差,而且能够有效滤除噪声,发现时间序列的模式特征。  相似文献   

16.
 时间序列的相似性度量是数据挖掘领域研究的一个热点,高维多元时间序列数据一般含有大量的噪声不利于相似性的比较。针对现有的时间序列度量方法存在的问题,在改进的时间序列自底向上融合算法的基础上,提出一种新的基于离均差的时间序列相似性度量的夹角余弦算法(Angle Cosine Metric Similarity,ACMS)。ACMS算法将时间序列等价为一个多维度的向量,充分考虑2个向量的方向和大小特征,增强振幅变化的鲁棒性,减少人为干扰,对数据挖掘中的聚类和预测具有帮助作用。  相似文献   

17.
针对时间序列相似性度量中欧氏距离对异常数据敏感以及DTW距离算法效率低的问题,提出基于滑动平均与分段线性回归的时间序列相似性方法。首先,使用初始可变滑动平均算法以及分段线性回归对原始时间序列进行数据变换,并将分段线性回归的参数(截距与距离)集作为时间序列的特征,以实现时间序列的特征提取和数据降维;然后,利用动态时间弯曲距离进行距离计算。该方法在时间序列相似性上与DTW算法的性能相近,但是在算法效率上几乎提高了96%。实验结果验证了该方法的有效性与准确性。  相似文献   

18.
针对目前的时间序列线性表示方法多采用启发式方法提取局部特征点作为分段点,容易陷入局部最优化,不能很好地表示时间序列全局特征,而且多采用单一的拟合误差作为阈值,不能准确预计分段数量,不利于后期进行的时间序列分析应用的问题。提出了一种新的固定分段数的表示方法--PLR_BTBU,首先根据二叉树层次遍历的思想,提取时间序列全局特征点将时间序列初始分段,再通过斜率变化特征将整个时间序列符号化,以各初始分段内的符号特征来确定各初始分段中的分段点分布,最后采用一种改进的固定分段数的自底向上融合算法,将各个子序列逐步融合到要求的分段数。实验结果表明,与已有的方法相比,该方法不仅较好地保留时间序列的全局特征,而且拟合后的时间序列和原时间序列之间的拟合误差更小。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号