首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
基于时间序列趋势转折点的分段线性表示*   总被引:10,自引:2,他引:8  
在充分利用时间序列时变特征的基础上,以有效地提取序列中的趋势和压缩原始数据为目标,提出了基于时间序列趋势转折点的分段线性表示方法。该方法在有效地提取序列中的趋势和压缩原始数据的同时,能够随着时间序列长度的增长对序列进行划分,具有高效、实现方法简便、效果直观的优点,对于不同领域的数据适应性良好。  相似文献   

2.
3.
时间序列数据趋势转折点提取算法   总被引:1,自引:0,他引:1  
时间序列数据蕴含趋势信息,可以根据数据的趋势信息提取趋势转折点,达到压缩数据、减少噪声影响的目的。通过分析时间序列数据的趋势信息,提出自适应数据趋势转折点提取算法。该算法不依赖任何先验知识,根据数据本身的趋势特征自动提取趋势转折点,提取信息包括坐标索引和对应数据。UCR时间序列分类数据集与SEEP、CAP和PAA等算法进行对比的实验结果表明,在多种数据情况下,该算法拟合误差和分类错误率更小,平均拟合误差为0.373 6,分类错误率同原始数据的分类错误率相比减少3.39%。  相似文献   

4.
随着计算机软、硬件的进步,人们利用信息技术产生和搜集数据的能力大幅度提高.作为数据挖掘的重要研究课题之一,时间序列的挖掘与预测近几年发展迅速.本文时时间序列的分段线性化表示进行了研究,采用新的分段线性化表示方法建立了序列相似性度量准则,弥补了以往度量准则对时间轴上伸缩的变化敏感的问题.新的表示方法和相似性度量准则使时间序列数据更容易应用传统的数据挖掘方法.  相似文献   

5.
实际过程中采集到的时间序列数据通常是海量数据,在原时间序列数据上直接进行数据挖掘的效率通常是低下的,有时甚至不可行,因此就须将时间序列在更高的层次上进行表示。借鉴时间序列线性分段的基本思想,提出了一种自适应误差约束的分段线性表示方法,该方法在查找出时间序列特殊点的基础上,通过给定误差e进行调节,可以自动地产生拟合线段的数目。不仅可以压缩数据,去除噪声,还能得到时间序列的模式变化特征。与一般的分段线性表示相比,文中方法的拟合误差更小,适应能力更强。  相似文献   

6.
基于函数的时间序列分段线性表示方法   总被引:1,自引:0,他引:1  
谢福鼎  王赫楠  张永  孙岩 《计算机科学》2011,38(11):153-155,160
考虑到时间序列的时间特性对不同区段的影响以及时间序列数据动态增长的实际情况,在RPAA ( Reversed Piecewise Aggregate Approximation)和PAA(Piecewise Aggregate Approximation)方法的基础上,提出了一种新的时间序列分段线性表示方法FPAA(Founction Piecewise Aggregate Approximation)。FPAA方法通过定义函数影响因子,克服了RPAA和PAA方法的不足。该方法具有线性时间复杂度,满足下界定理,并且支持时间序列的在线划分。实验表明,与PAA方法和RPAA方法相比,所提出的方法可以较有效地进行时间序列的在线查询。  相似文献   

7.
指出直接采用原始瓦斯浓度时间序列进行短期浓度预测、相似性查询、时间序列分类和聚类等数据挖掘工作不但效率低下,而且会影响时间序列数据挖掘的准确性和可靠性;提出了一种采用分段线性方法的时间序列模式表示方法。采用分段线性表示方法对瓦斯浓度时间序列进行模式表示后可换来较小的存储和计算代价,只保留了时间序列的主要形态,去除了细节干扰,更能反映出时间序列的自身特征,有利于提高数据挖掘的效率和准确性。  相似文献   

8.
基于时态边缘算子的时间序列分段线性表示   总被引:2,自引:1,他引:1  
时间序列的分段线性表示算法通常基于单一的启发式规则,难以适用于不同数据特征的时间序列。借鉴了边缘算子的思想来提取时间序列的边缘点,提出了一种基于时态边缘算子的时间序列分段线性表示算法。在来自不同领域的公开数据集上进行的实验结果表明:与两种主要的分段线性表示算法相比,该算法具有更好的拟合性能,并且更为稳定,能够适用于各类不同数据特征的时间序列。  相似文献   

9.
一种基于信息熵的时间序列分段线性表示方法   总被引:1,自引:0,他引:1  
针对部分时间序列具有高维、大数据量及数据更新速度较快的特点, 导致在原始时间序列上难以进行数据挖掘的问题, 提出一种基于信息熵的时间序列分段线性表示方法——PLR_IE。该算法利用信息熵作为评判重要点数量的性能指标, 从序列中提取重要分段点的数量分布情况, 利用重要点组成的序列重新拟合原始时间序列, 为下一步数据挖掘提供基础。实验结果表明, 该方法能高效地提取出序列主要特征、拟合原始序列。  相似文献   

10.
基于斜率提取边缘点的时间序列分段线性表示方法   总被引:7,自引:0,他引:7  
本文引入解析几何中的斜率,提出了一种新颖的基于斜率提取边缘点的时间序列分段线性表示方法SEEP。对于斜率变化范围比较集中的时间序列,SEEP表示方法有着非常好的效果,与以往的分段线性表示方法相比,SEEP表示方法与原始时间序列之间的拟合误差更小,而且要小很多;对于斜率变化范围比较大的时间序列,SEEP表示方法与原始时间序列之间的拟合误差,和以往的分段线性表示方法相比,也相差不大,并且SEEP表示方法计算简单,易于实现。算法的时间复杂度仅为O(n),  相似文献   

11.
针对目前的时间序列线性表示方法多采用启发式方法提取局部特征点作为分段点,容易陷入局部最优化,不能很好地表示时间序列全局特征,而且多采用单一的拟合误差作为阈值,不能准确预计分段数量,不利于后期进行的时间序列分析应用的问题。提出了一种新的固定分段数的表示方法--PLR_BTBU,首先根据二叉树层次遍历的思想,提取时间序列全局特征点将时间序列初始分段,再通过斜率变化特征将整个时间序列符号化,以各初始分段内的符号特征来确定各初始分段中的分段点分布,最后采用一种改进的固定分段数的自底向上融合算法,将各个子序列逐步融合到要求的分段数。实验结果表明,与已有的方法相比,该方法不仅较好地保留时间序列的全局特征,而且拟合后的时间序列和原时间序列之间的拟合误差更小。  相似文献   

12.
针对传统的时间序列分段算法往往忽略时间序列的时间特性,导致分段结果不够精确,对此,提出基于双曲正切函数约束的时间序列建模表示算法。该算法在分段聚合近似的基础上引入双曲正切函数并且提出了移动增强因子的概念,在考虑时间影响的基础上抽取出各个子序列所含信息量的差异完成最终的时间序列分段。实验表明该算法有较小的拟合误差,能够更好地利用分段后的序列,完成宏观的相似性查找等工作,并且满足时间序列动态增长的特点,算法的通用性、普适性、准确性均有所提高。  相似文献   

13.
为解决符号聚合近似方法(SAX)表示时间序列时忽略序列局部趋势的问题,提出一种融合形态趋势信息的时间序列符号聚合近似方法。该方法以子序列段中的最大值和最小值以及它们两者之间的相对位置为依据,定义一种新的趋势指标来描述子序列段的趋势,并使用融合趋势指标的符号矢量来近似表示时间序列。针对所提表示方法,给出一种新的距离度量方法,并在UCR数据集和电机转矩数据集上进行分类实验,实验结果表明,所提方法在绝大多数数据集上获得了较SAX方法更高的分类准确率,能够有效弥补SAX方法表示时间序列时忽略局部趋势的不足。  相似文献   

14.
基于重要点的时间序列线性分段算法能在较好地保留时间序列的全局特征的基础上达到较好的拟合精度。但传统的基于重要点的时间序列分段算法需要指定误差阈值等参数进行分段,这些参数与原始数据相关,用户不方便设定,而且效率和拟合效果有待于进一步提高。为了解决这一问题,提出一种基于时间序列重要点的分段算法——PLR_TSIP,该方法首先综合考虑到了整体拟合误差的大小和序列长度,接着针对优先级较高的分段进行预分段处理以期找到最优的分段;最后在分段时考虑到了分段中最大值点和最小值点的同异向关系,可以一次进行多个重要点的划分。通过多个数据集的实验分析对比,与传统的分段算法相比,减小了拟合误差,取得了更好的拟合效果;与其他重要点分段算法相比,在提高拟合效果的同时,较大地提高了分段效率。  相似文献   

15.
通过计算某一点与其左右两相邻点斜率的比值确定出变化点,连接这些变化点,就得到一种基于斜率变化阈值的时间序列分段线性STC表示算法。来自航天器不同分系统的真实数据集实验表明,使用STC算法作为航天器测试时间序列的模式表示方法,与其他分段线性表示算法相比,该方法具有算法简单、拟合程度高和适应能力强的特点。  相似文献   

16.
时间序列具有数据量大、维数高和更新速度快等特点,导致一般的分段线性方法难以刻画原始时间序列的全局趋势特征.针对时间序列的特性,提出了一种基于时态边缘算子的自主分段表示方法(简称APLR_TEO),能够有效刻画出时间序列的形状特征.首先通过时态边缘算子与原始时间序列做卷积并根据关联规则得到边缘极值点;然后根据时序的变化特...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号