首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
分段线性表示是时间序列降维的有效方法,其关键在于分割点的确定。在时间序列分段线性表示的基础上,提出一种新的基于重要点的时间序列分割方法。与一般方法比较相邻三点关系不同的是,将时间窗扩展为前一重要点、待考察点和一个指定时间窗组成的区间,再通过比较数据点前后模式变化来确定重要点。通过与其他7种分割方法进行实验比较,证明该方法适应能力强,不但分割结果总体质量高,在压缩率相同时具有更小的拟合误差,而且能够有效滤除噪声,发现时间序列的模式特征。  相似文献   

2.
陈然  戴齐 《微机发展》2011,(9):103-106
基于重要点探测技术的时间序列线性分段算法能较好地保留序列的全局特征和拟合高精确度。传统的基于重要点时间序列分段算法,只能通过误差阈值来控制分段,该方法不能预计分段数量,不能适应后期要求分段数量一定的应用。提出一种基于序列重要点的时间序列固定分段数的分段算法—PLR_FPIP,该方法借用二叉树层次遍历的思路,重新调整原方法的分段次序,使用重要点组成的直线段近似描述时间序列,该方法能够在分段数量一定的情况下对时间序列分段。实验证明,该分段算法能在固定分段数的情况下反映时间序列的主体特征,算法简单快速,整体拟合误差小。  相似文献   

3.
基于重要点的时间序列线性分段算法能在较好地保留时间序列的全局特征的基础上达到较好的拟合精度。但传统的基于重要点的时间序列分段算法需要指定误差阈值等参数进行分段,这些参数与原始数据相关,用户不方便设定,而且效率和拟合效果有待于进一步提高。为了解决这一问题,提出一种基于时间序列重要点的分段算法——PLR_TSIP,该方法首先综合考虑到了整体拟合误差的大小和序列长度,接着针对优先级较高的分段进行预分段处理以期找到最优的分段;最后在分段时考虑到了分段中最大值点和最小值点的同异向关系,可以一次进行多个重要点的划分。通过多个数据集的实验分析对比,与传统的分段算法相比,减小了拟合误差,取得了更好的拟合效果;与其他重要点分段算法相比,在提高拟合效果的同时,较大地提高了分段效率。  相似文献   

4.
田野  张忠能 《微型电脑应用》2012,28(2):48-51,72
时间序列数据是日常生活中十分常见的一类数据,由于它具有维数高,数据量大的特点,对这类数据进行压缩表示,是进一步进行数据挖掘的前提。首先将基于重要点的表示方法与其他几种表示方法进行了比较,然后对基于重要点的表示方法进行了改进,采用优先级队列作为辅助,在用户可以指定的压缩比例下,选出重要点。实验证明,该方法取得了良好的效果。  相似文献   

5.
时间序列的表示是时序数据挖掘的一个重要问题.重要点的分段表示法(IP)是目前应用最为广泛的时间序列特征提取方法之一,具有较好的数据压缩和去除噪声能力,但参数的选择对时间序列的近似效果有很大的影响而且难以找到重要的转折点.基于多分辨率的重要点检索分段方法(MIP)也是一种时间序列特征提取方法,该方法能很好地近似时间序列,但检索次数难以确定且运行效率比较低.为了改进以上两种方法的缺陷,提出了一种新的基于重要点的多分辨率检索表示法(MRIP).实验结果表明,与基于重要点分段方法相比,该方法误差更小,具有很好的压缩率,并能去除噪音干扰;与基于多分辨率的重要点检索分段方法相比,能较好地确定检索次数的范围,在近似效果相当的情况下,运算效率更高.  相似文献   

6.
基于分割模式的时间序列矢量符号化算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对符号化聚合近似算法(SAX)中时间序列必须等长分割的缺陷,提出一种基于分割模式的时间序列符号化算法(SMSAX)。利用三角阈值法对随机抽样的时间序列进行特征提取,计算时间序列最大压缩比,将其作为时间窗宽提取分割点,进而求出时间序列的分割模式。利用得到的分割模式对时间序列进行分割降维,通过均值和波动率对分割后的子序列进行向量符号化。根据时间序列特征对其进行不等长分割,并加入波动率消除奇异点的影响。实验结果表明,SMSAX能获得比SAX更精确的结果。  相似文献   

7.
结合层级实时记忆(Hierarchical Temporal Memory,HTM)模型与基于模式集的遗传时间序列分割算法各自的优点,用基于HTM的适应值函数替换原基于模式集的适应值函数,提出基于HTM的遗传时间序列分割算法。该算法可实现时间序列的分割及其相应子序列的分类识别。同时,针对HTM对训练样本的要求,提出一种基于模式集的HTM训练样本生成算法。最后在股票序列上验证了这2种算法的有效性。   相似文献   

8.
提出了基于关键点的时间序列分割算法。首先利用关键点方法压缩时间序列,完成时间序列的表示;然后利用二次回归及DTW方法完成时间序列的分割。分割后的时间序列主要用于异常模式的检测,有较好的效果。  相似文献   

9.
在线分割时间序列数据   总被引:15,自引:0,他引:15  
李爱国  覃征 《软件学报》2004,15(11):1671-1679
时间序列分割是时间序列数据挖掘研究的重要任务之一.它主要有两个应用:检测生成时间序列的系统何时发生变化;创建时间序列的高级数据表示,从而对时间序列进行索引、聚类和分类.在实时时间序列数据挖掘应用中,需要在线时间序列分割算法,以便实时发现和预测时态模式.在对时间序列分割问题进行形式化描述的基础上,提出了一种评估时间序列的分割结果以及分割算法性能的评价指标,并提出了一种在线分割时间序列数据的递推算法(on-line segmentation,简称OLS).OLS的一个显著特点是不依赖有关时间序列的先验知识.实验结果说明,OLS算法能够有效地在线检测出数据挖掘应用中感兴趣的关键变化点,而且"过拟合"程度低.  相似文献   

10.
时间序列的相似性的分层查询   总被引:1,自引:0,他引:1  
提出了一种新的基于重要点的分段方法,将时间序列数据转换为趋势序列。在进行相似性比较时先进行趋势相似的比较,然后对结果进行欧氏距离的比较。实验结果表明该算法是有效的。  相似文献   

11.
时间序列重要点分割的异常子序列检测   总被引:1,自引:1,他引:0  
时间序列具有数据量大的特点,直接对其检测复杂度高。因此提出了一种基于时间序列重要点的异常子序列检测算法。子序列的异常检测弥补了点异常检测的局限性。该算法首先获得了一系列平滑后的重要点,然后根据其进行子序列划分,并提取每个子序列的4个特征值:长度、高度、均值和标准差,将其运用到欧氏距离中,最后通过KNN算法来检测异常子序列。实验证明了该算法的有效性和可行性。  相似文献   

12.
孙焘  冯林  郑虎  高成锴 《计算机工程》2009,35(22):26-28
通过高维时间序列分割可以创建高级符号表示。提出一种针对高维时间序列的无监督分割算法,用于解决高维数据符号化的预处理问题。该算法实现对高维数据的聚类,应用最大熵投票模型进行序列分割。实验结果表明,其平均查全率和查准率分别为0.86和0.88,且整体性能优于主成分分析算法和概率主成分分析算法。  相似文献   

13.
基于变化点的时间序列近似表示   总被引:1,自引:0,他引:1  
时间序列的近似表示能够提高时间序列数据挖掘的效率和可靠性。提出了一种基于变化点的时间序列近似表示,具有简单直观、近似质量高、适应能力强等优点。在来自不同领域的真实数据集上的实验表明:与时间序列的重要点分段表示和分段常量表示相比,基于变化点的时间序列近似表示在近似质量和适应能力上都具有明显的优势。  相似文献   

14.
刘贺贺  贺延俏  邓诗卓  吴刚  王波涛 《软件学报》2023,34(11):5267-5281
时间序列分割是数据挖掘领域中的一个重要研究方向.目前基于矩阵轮廓(matrix profile, MP)的时间序列分割技术得到了越来越多研究人员的关注,并且取得了不错的研究成果.不过该技术及其衍生算法仍然存在不足:首先,基于矩阵轮廓的快速低代价语义分割算法中对给定活动状态的时间序列分割时,最近邻之间通过弧进行连接,会出现弧跨越非目标活动状态匹配相似子序列问题;其次,现有提取分割点算法在提取分割点时采用给定长度窗口,容易得到与真实值偏差较大的分割点,降低准确性.针对以上问题,提出一种限制弧跨越的时间序列分割算法(limit arc curve cross-FLOSS, LAC-FLOSS),该算法给弧添加权重,形成一种带权弧,并通过设置匹配距离阈值解决弧的跨状态子序列误匹配问题.此外,提出一种改进的提取分割点算法(improved extract regimes, IER),它通过纠正弧跨越(corrected arc crossings, CAC)序列的形状特性,从波谷中提取极值,避免直接使用窗口在非拐点处取到分割点的问题.在公开数据集datasets_seg和Mobi Act上面进行...  相似文献   

15.
郝石磊  王志海  刘海洋 《软件学报》2022,33(5):1817-1832
时间序列分类问题是时间序列数据挖掘中的一项重要任务, 近些年受到了越来越广泛的关注. 该问题的一个重要组成部分就是时间序列间的相似性度量. 在众多相似性度量算法中, 动态时间规整是一种非常有效的算法,目前已经被广泛应用到视频、音频、手写体识别以及生物信息处理等众多领域. 动态时间规整本质上是一种在边界及时间一致性约束下...  相似文献   

16.
史明阳  王鹏  汪卫 《计算机工程》2020,46(5):131-138
时间序列分割与状态识别是一项重要的时间序列挖掘任务,可用于识别被监测对象的运行状态,然而目前多数无监督时间序列分割算法得到的结果无法满足用户的状态识别期望。为实现符合用户意图的时间序列分割,提出一种有监督的时间序列分割算法。构造特征集合并自动训练特征概率模型参数,以此构建特征高斯概率分布模型进行相关序列的特征设计,同时利用匹配损失计算和改进的贪心策略设定特征权重约束,通过增加分割位置约束条件及增量计算2种优化方式提高分割效率。在多个真实数据集上的实验结果表明,与pHMM和AutoPlait算法相比,该算法可以全面表达状态类别,对时间序列进行更精准的分割。  相似文献   

17.
基于互关联后继树的时间序列相似性查询   总被引:4,自引:0,他引:4  
时间序列的相似性查询是分析时间序列变化规律的一种重要方法,对于时间序列的分类、预测以及知识发现都具有重要的现实意义。提出了一种基于分段技术的、同时支持可变长度的快速相似性查询方法。其主要思想是:首先依据序列变化的重要点将序列逐步分段,抽取各子段的变化特征,通过分类方法将其转变成符号序列,在此基础上,引入一种称为互关联后继树的全文索引技术,从而实现序列的快速相似性查询,其时间复杂度降到了O(L),此外,该算法还保证在建立索引后查询结果不会有任何的错误丢失。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号