首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
基于重要点的时间序列线性分段算法能在较好地保留时间序列的全局特征的基础上达到较好的拟合精度。但传统的基于重要点的时间序列分段算法需要指定误差阈值等参数进行分段,这些参数与原始数据相关,用户不方便设定,而且效率和拟合效果有待于进一步提高。为了解决这一问题,提出一种基于时间序列重要点的分段算法——PLR_TSIP,该方法首先综合考虑到了整体拟合误差的大小和序列长度,接着针对优先级较高的分段进行预分段处理以期找到最优的分段;最后在分段时考虑到了分段中最大值点和最小值点的同异向关系,可以一次进行多个重要点的划分。通过多个数据集的实验分析对比,与传统的分段算法相比,减小了拟合误差,取得了更好的拟合效果;与其他重要点分段算法相比,在提高拟合效果的同时,较大地提高了分段效率。  相似文献   

2.
基于序列重要点的时间序列分割   总被引:7,自引:1,他引:6       下载免费PDF全文
时间序列包含的数据量大、维数高、数据更新快,很难直接在原始时间序列上进行数据挖掘。该文提出一种基于序列重要点(SIP)的时间序列分割算法——PLR_SIP,用SIP组成的直线段近似描述时间序列。将SIP作为时间序列的分割点,反映时间序列的主要特征,降低时间序列的维数,使整体误差达到最小。  相似文献   

3.
田野  张忠能 《微型电脑应用》2012,28(2):48-51,72
时间序列数据是日常生活中十分常见的一类数据,由于它具有维数高,数据量大的特点,对这类数据进行压缩表示,是进一步进行数据挖掘的前提。首先将基于重要点的表示方法与其他几种表示方法进行了比较,然后对基于重要点的表示方法进行了改进,采用优先级队列作为辅助,在用户可以指定的压缩比例下,选出重要点。实验证明,该方法取得了良好的效果。  相似文献   

4.
分段线性表示是时间序列降维的有效方法,其关键在于分割点的确定。在时间序列分段线性表示的基础上,提出一种新的基于重要点的时间序列分割方法。与一般方法比较相邻三点关系不同的是,将时间窗扩展为前一重要点、待考察点和一个指定时间窗组成的区间,再通过比较数据点前后模式变化来确定重要点。通过与其他7种分割方法进行实验比较,证明该方法适应能力强,不但分割结果总体质量高,在压缩率相同时具有更小的拟合误差,而且能够有效滤除噪声,发现时间序列的模式特征。  相似文献   

5.
时间序列的表示是时序数据挖掘的一个重要问题.重要点的分段表示法(IP)是目前应用最为广泛的时间序列特征提取方法之一,具有较好的数据压缩和去除噪声能力,但参数的选择对时间序列的近似效果有很大的影响而且难以找到重要的转折点.基于多分辨率的重要点检索分段方法(MIP)也是一种时间序列特征提取方法,该方法能很好地近似时间序列,但检索次数难以确定且运行效率比较低.为了改进以上两种方法的缺陷,提出了一种新的基于重要点的多分辨率检索表示法(MRIP).实验结果表明,与基于重要点分段方法相比,该方法误差更小,具有很好的压缩率,并能去除噪音干扰;与基于多分辨率的重要点检索分段方法相比,能较好地确定检索次数的范围,在近似效果相当的情况下,运算效率更高.  相似文献   

6.
针对目前的时间序列线性表示方法多采用启发式方法提取局部特征点作为分段点,容易陷入局部最优化,不能很好地表示时间序列全局特征,而且多采用单一的拟合误差作为阈值,不能准确预计分段数量,不利于后期进行的时间序列分析应用的问题。提出了一种新的固定分段数的表示方法--PLR_BTBU,首先根据二叉树层次遍历的思想,提取时间序列全局特征点将时间序列初始分段,再通过斜率变化特征将整个时间序列符号化,以各初始分段内的符号特征来确定各初始分段中的分段点分布,最后采用一种改进的固定分段数的自底向上融合算法,将各个子序列逐步融合到要求的分段数。实验结果表明,与已有的方法相比,该方法不仅较好地保留时间序列的全局特征,而且拟合后的时间序列和原时间序列之间的拟合误差更小。  相似文献   

7.
针对分段线性表示(即一阶线性函数表示)或分段常数表示(即零阶函数表示)在时间序列近似表示中拟合误差较大的问题,提出时间序列高阶函数分段表示方法。通过建立高阶函数候选集模型,利用拟合误差指标选取最优函数,为保证在分段点处连续,引入断点处约束条件;在分段点选取方式上,设定观测值变化阈值及分段区间阈值,保证压缩率的同时,保留重要点信息。实验结果表明,该算法相对于分段线性表示和分段常数表示,能更好地拟合原始序列。  相似文献   

8.
基于分段时间弯曲距离的时间序列挖掘   总被引:22,自引:1,他引:22  
在时间序列库中的数据挖掘是个重要的课题,为了在挖掘的过程中比较序列的相似性,大量的研究都采用了欧氏距离度量或者其变形,但是欧氏距离及其变形对序列在时间轴上的偏移非常敏感.因此,采用了更鲁棒的动态时间弯曲距离,允许序列在时间轴上的弯曲,并且提出了一种新的序列分段方法,在此基础上定义了特征点分段时间弯曲距离.与经典时间弯曲距离相比,大大提高了效率,而且保证了近似的准确性.  相似文献   

9.
随着计算机软、硬件的进步,人们利用信息技术产生和搜集数据的能力大幅度提高.作为数据挖掘的重要研究课题之一,时间序列的挖掘与预测近几年发展迅速.本文时时间序列的分段线性化表示进行了研究,采用新的分段线性化表示方法建立了序列相似性度量准则,弥补了以往度量准则对时间轴上伸缩的变化敏感的问题.新的表示方法和相似性度量准则使时间序列数据更容易应用传统的数据挖掘方法.  相似文献   

10.
抽象出时间序列的多段线性特征,并提出一种时间序列分类算法.该算法包括3个模块:导数估值函数,线性分段方法,DDHMM模型(基于HMM).首先,利用导数估值函数与线性分段方法检测多段线性特征,若满足多线段特征,则将时间序列转化为特定结构的观察值序列;然后,利用训练观察值序列训练DDHMM模型,通过比较各模型产生测试观察值序列的概率值进行分类.实验表明,针对满足多段线性特征的时间序列,该算法具有较高的分类精度,应用在UCI数据集和实际工程中,分类效果好.  相似文献   

11.
基于互关联后继树的时间序列相似性查询   总被引:4,自引:0,他引:4  
时间序列的相似性查询是分析时间序列变化规律的一种重要方法,对于时间序列的分类、预测以及知识发现都具有重要的现实意义。提出了一种基于分段技术的、同时支持可变长度的快速相似性查询方法。其主要思想是:首先依据序列变化的重要点将序列逐步分段,抽取各子段的变化特征,通过分类方法将其转变成符号序列,在此基础上,引入一种称为互关联后继树的全文索引技术,从而实现序列的快速相似性查询,其时间复杂度降到了O(L),此外,该算法还保证在建立索引后查询结果不会有任何的错误丢失。  相似文献   

12.
孙焘  冯林  郑虎  高成锴 《计算机工程》2009,35(22):26-28
通过高维时间序列分割可以创建高级符号表示。提出一种针对高维时间序列的无监督分割算法,用于解决高维数据符号化的预处理问题。该算法实现对高维数据的聚类,应用最大熵投票模型进行序列分割。实验结果表明,其平均查全率和查准率分别为0.86和0.88,且整体性能优于主成分分析算法和概率主成分分析算法。  相似文献   

13.
结合层级实时记忆(Hierarchical Temporal Memory,HTM)模型与基于模式集的遗传时间序列分割算法各自的优点,用基于HTM的适应值函数替换原基于模式集的适应值函数,提出基于HTM的遗传时间序列分割算法。该算法可实现时间序列的分割及其相应子序列的分类识别。同时,针对HTM对训练样本的要求,提出一种基于模式集的HTM训练样本生成算法。最后在股票序列上验证了这2种算法的有效性。   相似文献   

14.
基于点分布特征的多元时间序列模式匹配方法   总被引:5,自引:0,他引:5  
多元时间序列模式匹配的常用方法难以刻画序列的全局形状特征,比如,Euclid方法的鲁棒性不够强;而PCA方法不适合处理小规模多元时间序列.基于点的统计分布提出了一种能够有效刻画多元时间序列形状特征的模式匹配方法.首先,提取多元时间序列样本的局部重要点,作为模式描述的方式;然后,根据重要点的统计分布特点构建特征模式向量,并借助Euclid范数来度量两个特征模式向量之间的相似程度,进而进行多元时间序列模式匹配.采用该方法进行模式匹配,充分利用了序列的全局形状特征.实验结果表明,基于点分布特征的多元时间序列模式匹配能够有效地刻画序列的形状特征,且能处理多种规模的序列数据.  相似文献   

15.
本文研究了时间序列的分析方法,具体分析了基于最大Lyapunov指数的方法在太阳黑子时间序列分析中的应用。介绍利用MATLAB对太阳黑子时间序列进行分析与仿真的方法,并给出相关的流程、程序和相应的仿真结果。最终证明太阳黑子时间序列是一个混沌时间序列。  相似文献   

16.
现代数据科学中存在大量的多维时间序列数据,检测多维时间序列中的最新变化点对于短期预测很重要。一种改进的方法被提出,以检测此类多维时间序列数据中最新变化点。通过使用小波变换,将多维时间序列中的变化点检测问题转化为相对较容易的多维面板数据中的变化点检测问题。该方法旨在跨时间序列合并信息,以便优先推断多个序列中同一时间点的最...  相似文献   

17.
裁剪表示是时间序列降维表示研究领域中一种重要的数据驱动表示方法,该类方法将原始时间序列数据转换为一组由0和1组成的序列。然而,传统裁剪表示方法忽略了时间序列中数据点对序列趋势变化的影响,同时无法自定义降维表示后的压缩率。为了解决以上问题,提出了一种基于核转折点的裁剪表示方法KTPC,并基于KTPC表示方法提出了一种高效的时间序列异常检测算法KTPC-AD。所提方法按照指定的压缩率寻找时间序列中的核转折点,将时间序列转换为由核转折点裁剪表示形成的一组0和1序列,利用KTPC-AD算法计算时间序列的异常得分,最终获得异常序列。实验结果表明,KTPC方法具有较高的表示效率,基于KTPC表示的时间序列异常检测算法不仅降低了异常检测的时间复杂度,同时有效提升了异常检测精度。  相似文献   

18.
基于自相似的金融时间序列波动聚集性研究   总被引:1,自引:0,他引:1  
自相似与波动聚集性是金融时间序列的两个重要特征,文章将这两个特征结合,提出了一种基于自相似的波动聚集模型。基于该模型提出了一种基于拟合优度与趋势变动的联机时间序列分割算法,算法能够根据波动的自相似特征将序列分割为多个子序列,从而用于研究在不同时段金融时间序列波动的自相似性。对实际数据的实验结果表明,文章所提出的模型和分割算法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号