首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 84 毫秒
1.
基于序列重要点的时间序列分割   总被引:6,自引:1,他引:6       下载免费PDF全文
时间序列包含的数据量大、维数高、数据更新快,很难直接在原始时间序列上进行数据挖掘。该文提出一种基于序列重要点(SIP)的时间序列分割算法——PLR_SIP,用SIP组成的直线段近似描述时间序列。将SIP作为时间序列的分割点,反映时间序列的主要特征,降低时间序列的维数,使整体误差达到最小。  相似文献   

2.
陈然  戴齐 《微机发展》2011,(9):103-106
基于重要点探测技术的时间序列线性分段算法能较好地保留序列的全局特征和拟合高精确度。传统的基于重要点时间序列分段算法,只能通过误差阈值来控制分段,该方法不能预计分段数量,不能适应后期要求分段数量一定的应用。提出一种基于序列重要点的时间序列固定分段数的分段算法—PLR_FPIP,该方法借用二叉树层次遍历的思路,重新调整原方法的分段次序,使用重要点组成的直线段近似描述时间序列,该方法能够在分段数量一定的情况下对时间序列分段。实验证明,该分段算法能在固定分段数的情况下反映时间序列的主体特征,算法简单快速,整体拟合误差小。  相似文献   

3.
基于重要点的时间序列线性分段算法能在较好地保留时间序列的全局特征的基础上达到较好的拟合精度。但传统的基于重要点的时间序列分段算法需要指定误差阈值等参数进行分段,这些参数与原始数据相关,用户不方便设定,而且效率和拟合效果有待于进一步提高。为了解决这一问题,提出一种基于时间序列重要点的分段算法——PLR_TSIP,该方法首先综合考虑到了整体拟合误差的大小和序列长度,接着针对优先级较高的分段进行预分段处理以期找到最优的分段;最后在分段时考虑到了分段中最大值点和最小值点的同异向关系,可以一次进行多个重要点的划分。通过多个数据集的实验分析对比,与传统的分段算法相比,减小了拟合误差,取得了更好的拟合效果;与其他重要点分段算法相比,在提高拟合效果的同时,较大地提高了分段效率。  相似文献   

4.
田野  张忠能 《微型电脑应用》2012,28(2):48-51,72
时间序列数据是日常生活中十分常见的一类数据,由于它具有维数高,数据量大的特点,对这类数据进行压缩表示,是进一步进行数据挖掘的前提。首先将基于重要点的表示方法与其他几种表示方法进行了比较,然后对基于重要点的表示方法进行了改进,采用优先级队列作为辅助,在用户可以指定的压缩比例下,选出重要点。实验证明,该方法取得了良好的效果。  相似文献   

5.
时间序列的表示是时序数据挖掘的一个重要问题.重要点的分段表示法(IP)是目前应用最为广泛的时间序列特征提取方法之一,具有较好的数据压缩和去除噪声能力,但参数的选择对时间序列的近似效果有很大的影响而且难以找到重要的转折点.基于多分辨率的重要点检索分段方法(MIP)也是一种时间序列特征提取方法,该方法能很好地近似时间序列,但检索次数难以确定且运行效率比较低.为了改进以上两种方法的缺陷,提出了一种新的基于重要点的多分辨率检索表示法(MRIP).实验结果表明,与基于重要点分段方法相比,该方法误差更小,具有很好的压缩率,并能去除噪音干扰;与基于多分辨率的重要点检索分段方法相比,能较好地确定检索次数的范围,在近似效果相当的情况下,运算效率更高.  相似文献   

6.
基于分割模式的时间序列矢量符号化算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对符号化聚合近似算法(SAX)中时间序列必须等长分割的缺陷,提出一种基于分割模式的时间序列符号化算法(SMSAX)。利用三角阈值法对随机抽样的时间序列进行特征提取,计算时间序列最大压缩比,将其作为时间窗宽提取分割点,进而求出时间序列的分割模式。利用得到的分割模式对时间序列进行分割降维,通过均值和波动率对分割后的子序列进行向量符号化。根据时间序列特征对其进行不等长分割,并加入波动率消除奇异点的影响。实验结果表明,SMSAX能获得比SAX更精确的结果。  相似文献   

7.
基于点分布特征的多元时间序列模式匹配方法   总被引:5,自引:0,他引:5  
多元时间序列模式匹配的常用方法难以刻画序列的全局形状特征,比如,Euclid方法的鲁棒性不够强;而PCA方法不适合处理小规模多元时间序列.基于点的统计分布提出了一种能够有效刻画多元时间序列形状特征的模式匹配方法.首先,提取多元时间序列样本的局部重要点,作为模式描述的方式;然后,根据重要点的统计分布特点构建特征模式向量,并借助Euclid范数来度量两个特征模式向量之间的相似程度,进而进行多元时间序列模式匹配.采用该方法进行模式匹配,充分利用了序列的全局形状特征.实验结果表明,基于点分布特征的多元时间序列模式匹配能够有效地刻画序列的形状特征,且能处理多种规模的序列数据.  相似文献   

8.
结合层级实时记忆(Hierarchical Temporal Memory,HTM)模型与基于模式集的遗传时间序列分割算法各自的优点,用基于HTM的适应值函数替换原基于模式集的适应值函数,提出基于HTM的遗传时间序列分割算法。该算法可实现时间序列的分割及其相应子序列的分类识别。同时,针对HTM对训练样本的要求,提出一种基于模式集的HTM训练样本生成算法。最后在股票序列上验证了这2种算法的有效性。   相似文献   

9.
针对重标级差分析法(Rescaled Range Analysis,R/S)在时间序列挖掘中的应用,提出了一种基于R/S分析的时间序列分割模型和算法,该算法能够根据序列波动的聚集性和自相似的特征,将序列分割为多个子序列。实验结论表明该方法可以发现时间序列的波动变化规律,方法有效、正确。  相似文献   

10.
提出了基于关键点的时间序列分割算法。首先利用关键点方法压缩时间序列,完成时间序列的表示;然后利用二次回归及DTW方法完成时间序列的分割。分割后的时间序列主要用于异常模式的检测,有较好的效果。  相似文献   

11.
针对分段线性表示(即一阶线性函数表示)或分段常数表示(即零阶函数表示)在时间序列近似表示中拟合误差较大的问题,提出时间序列高阶函数分段表示方法。通过建立高阶函数候选集模型,利用拟合误差指标选取最优函数,为保证在分段点处连续,引入断点处约束条件;在分段点选取方式上,设定观测值变化阈值及分段区间阈值,保证压缩率的同时,保留重要点信息。实验结果表明,该算法相对于分段线性表示和分段常数表示,能更好地拟合原始序列。  相似文献   

12.
时间序列异常检测   总被引:3,自引:0,他引:3  
在k-近邻局部异常检测算法的基础上,结合时间序列的分割方法,提出了一种高效的时间序列异常检测算法。该算法首先把序列重要点作为数据的分割点,对时间序列数据进行高比例压缩;其次利用局部异常检测方法检测出时间序列中的异常模式。通过心电图(ECG)数据实验验证了算法的有效性和合理性。  相似文献   

13.
在分析边缘算子的思想和现有时间序列模式表示方法基础上,将边缘点方法和重要点方法相结合,提出了基于重要边缘点的时间序列模式表示算法。算法按各观测点的边缘化程度,提取重要的边缘点将时间序列分成多个子线段,通过分析直线段之间的相似性,发现异常的序列模式。从理论和实验两方面对算法进行了分析和验证,结果表明,算法复杂度较低,模式表示误差小,能够满足大规模时间序列数据模式表示的要求。  相似文献   

14.
基于时间序列趋势转折点的分段线性表示*   总被引:10,自引:2,他引:8  
在充分利用时间序列时变特征的基础上,以有效地提取序列中的趋势和压缩原始数据为目标,提出了基于时间序列趋势转折点的分段线性表示方法。该方法在有效地提取序列中的趋势和压缩原始数据的同时,能够随着时间序列长度的增长对序列进行划分,具有高效、实现方法简便、效果直观的优点,对于不同领域的数据适应性良好。  相似文献   

15.
对城市中发生的事件进行有效预测,可以为政府避免、控制或减轻相关的社会风险提供决策支撑.首先,提出基于积分求导法的条件强度函数式,提高序列预测精度;其次,构建基于递归神经网络和累积危险函数的时间点过程模型,通过递归神经网络捕获历史事件的非线性依赖关系,利用全连接网络获得累积危险函数;最后,选择具有代表性的合成数据集和真实...  相似文献   

16.
针对时间序列的数据挖掘将时间序列数据转换为离散的符号序列, 提出了一种基于滑动窗口及局部特征的时间序列符号化方法。该方法采用了滑动窗口的方法将时间序列分割, 每个分段采用多个斜率表示, 最后采用K-均值聚类算法对斜率表示的分段进行聚类, 实现时间序列的符号化。实验证明了该方法的有效性与准确性。  相似文献   

17.
邹蕾  高学东 《计算机应用》2016,36(9):2472-2474
时间序列子序列匹配作为时间序列检索、聚类、分类、异常监测等挖掘任务的基础被广泛研究。但传统的时间序列子序列匹配都是对精确相同或近似相同的模式进行匹配,为此定义了一种全新的具有相似发展趋势的序列模式——时间序列同构关系,经过数学推导给出了时间序列同构关系判定的法则,并基于此提出了同构关系时间序列片段发现的算法。该算法首先对原始时间序列进行预处理,然后分段拟合后对各时间序列分段进行同构关系判定。针对现实背景数据难以满足理论约束的问题,通过定义一个同构关系容忍度参数使实际时间序列数据的同构关系挖掘成为可能。实验结果表明,该算法能有效挖掘出满足同构关系的时间序列片段。  相似文献   

18.
分段线性表示是时间序列降维的有效方法。在总结分析序列趋势变化特点的基础上,提出了一种基于趋势转折点的时间序列分段线性表示算法。首先定义了趋势转折点作为时间序列分段点的备选集,以点到区域的距离度量趋势转折点的重要性,再根据给定的阈值选择重要趋势转折点作为分段点,对时间序列进行分段线性表示。通过与其他6种方法进行实验比较,结果表明:所提方法在具有较好的拟合质量和适应能力以及对转折点明显的序列,都表现出较强的抗噪声干扰能力。  相似文献   

19.
一种基于Normal矩阵的时间序列聚类方法*   总被引:2,自引:0,他引:2  
提出了一种基于Normal矩阵的时间序列聚类方法。该算法首先对时间序列数据进行向量形式转换,计算出各个时间序列间的相似度并构建复杂网络,然后利用基于Normal矩阵的方法进行复杂网络社团划分,同一类的时间序列被划分到一个社团,即实现对时间序列数据的聚类。为了验证该方法的可行性和有效性,将其应用于股票时间序列数据聚类分析中,并在两个实际的数据集上与其他方法相比较,取得了较好的实验结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号