首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
裁剪表示是时间序列降维表示研究领域中一种重要的数据驱动表示方法,该类方法将原始时间序列数据转换为一组由0和1组成的序列。然而,传统裁剪表示方法忽略了时间序列中数据点对序列趋势变化的影响,同时无法自定义降维表示后的压缩率。为了解决以上问题,提出了一种基于核转折点的裁剪表示方法KTPC,并基于KTPC表示方法提出了一种高效的时间序列异常检测算法KTPC-AD。所提方法按照指定的压缩率寻找时间序列中的核转折点,将时间序列转换为由核转折点裁剪表示形成的一组0和1序列,利用KTPC-AD算法计算时间序列的异常得分,最终获得异常序列。实验结果表明,KTPC方法具有较高的表示效率,基于KTPC表示的时间序列异常检测算法不仅降低了异常检测的时间复杂度,同时有效提升了异常检测精度。  相似文献   

2.
随着计算机软、硬件的进步,人们利用信息技术产生和搜集数据的能力大幅度提高.作为数据挖掘的重要研究课题之一,时间序列的挖掘与预测近几年发展迅速.本文时时间序列的分段线性化表示进行了研究,采用新的分段线性化表示方法建立了序列相似性度量准则,弥补了以往度量准则对时间轴上伸缩的变化敏感的问题.新的表示方法和相似性度量准则使时间序列数据更容易应用传统的数据挖掘方法.  相似文献   

3.
胡珉  白雪  徐伟  吴秉键 《计算机应用》2020,40(6):1553-1564
随着信息化技术不断提高,时序数据规模呈指数级增长,为时间序列异常检测算法发展提供了契机和挑战,也使其逐步成为数据分析领域新增的研究热点。然而,这一方面的研究仍处于初步阶段,研究工作的系统性不强。为此,通过整理和分析国内外文献,将多维时间序列异常检测的研究内容按照逻辑顺序分为“维数约简”“时间序列模式表示”和“异常模式发现”三个方面,并对其主流算法进行梳理和归纳,以全面展现当前异常检测的研究现状和特点。在此基础上,还指出了多维时间序列异常检测算法的研究难点和研究趋势,以期对相关理论和应用研究提供有益的参考。  相似文献   

4.
基于小波熵的时间序列分段聚合近似表示   总被引:2,自引:0,他引:2  
由于时间序列数据具有高维性等特征,不易直接进行挖掘.在对时间序列数据进行挖掘之前通常先进行特征表示达到降维的目的,分段聚合近似表示(PAA)是特征表示方法中比较常用的一种,针对PAA算法对每一区间有平均对待的缺点,提出一种采用小波熵的时间序列分段聚合近似表示,将小波熵运用到PAA算法的改进中,把某一区间内的小波能量熵值作为判评区间复杂度的指标,按各区间内小波熵值的比重分配各区间内分段数,实现对复杂区间详细描述,对相对平稳区间粗略逼近,利用matlab平台仿真证明,上述方法在压缩比相同的情况下比PAA方法更好地拟合原始序列,不仅能对时间序列有效地降维,而且能使近似更加精确,进而实现时间序列数据挖掘效率的提高.  相似文献   

5.
分段线性表示是时间序列降维的有效方法。在总结分析序列趋势变化特点的基础上,提出了一种基于趋势转折点的时间序列分段线性表示算法。首先定义了趋势转折点作为时间序列分段点的备选集,以点到区域的距离度量趋势转折点的重要性,再根据给定的阈值选择重要趋势转折点作为分段点,对时间序列进行分段线性表示。通过与其他6种方法进行实验比较,结果表明:所提方法在具有较好的拟合质量和适应能力以及对转折点明显的序列,都表现出较强的抗噪声干扰能力。  相似文献   

6.
实际过程中采集到的时间序列数据通常是海量数据,在原时间序列数据上直接进行数据挖掘的效率通常是低下的,有时甚至不可行,因此就须将时间序列在更高的层次上进行表示。借鉴时间序列线性分段的基本思想,提出了一种自适应误差约束的分段线性表示方法,该方法在查找出时间序列特殊点的基础上,通过给定误差e进行调节,可以自动地产生拟合线段的数目。不仅可以压缩数据,去除噪声,还能得到时间序列的模式变化特征。与一般的分段线性表示相比,文中方法的拟合误差更小,适应能力更强。  相似文献   

7.
基于函数的时间序列分段线性表示方法   总被引:1,自引:0,他引:1  
谢福鼎  王赫楠  张永  孙岩 《计算机科学》2011,38(11):153-155,160
考虑到时间序列的时间特性对不同区段的影响以及时间序列数据动态增长的实际情况,在RPAA ( Reversed Piecewise Aggregate Approximation)和PAA(Piecewise Aggregate Approximation)方法的基础上,提出了一种新的时间序列分段线性表示方法FPAA(Founction Piecewise Aggregate Approximation)。FPAA方法通过定义函数影响因子,克服了RPAA和PAA方法的不足。该方法具有线性时间复杂度,满足下界定理,并且支持时间序列的在线划分。实验表明,与PAA方法和RPAA方法相比,所提出的方法可以较有效地进行时间序列的在线查询。  相似文献   

8.
指出直接采用原始瓦斯浓度时间序列进行短期浓度预测、相似性查询、时间序列分类和聚类等数据挖掘工作不但效率低下,而且会影响时间序列数据挖掘的准确性和可靠性;提出了一种采用分段线性方法的时间序列模式表示方法。采用分段线性表示方法对瓦斯浓度时间序列进行模式表示后可换来较小的存储和计算代价,只保留了时间序列的主要形态,去除了细节干扰,更能反映出时间序列的自身特征,有利于提高数据挖掘的效率和准确性。  相似文献   

9.
基于时间序列趋势转折点的分段线性表示*   总被引:10,自引:2,他引:8  
在充分利用时间序列时变特征的基础上,以有效地提取序列中的趋势和压缩原始数据为目标,提出了基于时间序列趋势转折点的分段线性表示方法。该方法在有效地提取序列中的趋势和压缩原始数据的同时,能够随着时间序列长度的增长对序列进行划分,具有高效、实现方法简便、效果直观的优点,对于不同领域的数据适应性良好。  相似文献   

10.
无监督多元时间序列(MTS)异常检测方法因标注成本低而广受关注,但传统方法一般基于两个假设:1)服从独立同分布(IID)假设,即假设时序数据样本之间和属性之间不存在依赖关系;2)高净度启动假设,即假设可拥有完全正常态的时序数据集进行训练。以上假设在实际场景中往往难以满足。为此,提出一种基于边缘异常候选集的迭代式主动多元时序异常检测算法(EraseMTS)。首先,利用一种多粒度时序特征学习方法捕捉子序列内和子序列间的依赖关系,并在此基础上对原始多元时间序列进行再表示;其次,提出一种利用边缘异常候选集的选择策略,以子序列异常得分为基础,同时考虑异常程度,选择待人工交互的范围;最后,提出一种迭代式子序列权重更新机制,将异常反馈信息融入无监督异常检测模型的训练过程中,通过迭代方式不断优化初始训练模型性能。在UCR时间序列库中的4个数据集和1个人工合成数据集上对所提算法的检测性能、可扩展性和稳定性进行验证,实验结果表明该算法能够有效且稳定运行。  相似文献   

11.
基于时态边缘算子的时间序列分段线性表示   总被引:2,自引:1,他引:1  
时间序列的分段线性表示算法通常基于单一的启发式规则,难以适用于不同数据特征的时间序列。借鉴了边缘算子的思想来提取时间序列的边缘点,提出了一种基于时态边缘算子的时间序列分段线性表示算法。在来自不同领域的公开数据集上进行的实验结果表明:与两种主要的分段线性表示算法相比,该算法具有更好的拟合性能,并且更为稳定,能够适用于各类不同数据特征的时间序列。  相似文献   

12.
时间序列的表示与分类算法综述   总被引:1,自引:0,他引:1  
时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内,依照给定的采样率,对某种潜在过程进行观测的结果。时间序列数据广泛地存在于商业、农业、气象、生物科学以及生态学等诸多领域,从时间序列中发现有用的知识已成为数据挖掘领域的研究热点之一。在时间序列表示方面,主要介绍了非数据适应性表示方法、数据适应性表示方法和基于模型的表示方法;针对时间序列的分类方法,着重介绍了基于时域相似性、形状相似性和变化相似性的分类算法,并对未来的研究方向进行了进一步的展望。  相似文献   

13.
一种基于信息熵的时间序列分段线性表示方法   总被引:1,自引:0,他引:1  
针对部分时间序列具有高维、大数据量及数据更新速度较快的特点, 导致在原始时间序列上难以进行数据挖掘的问题, 提出一种基于信息熵的时间序列分段线性表示方法——PLR_IE。该算法利用信息熵作为评判重要点数量的性能指标, 从序列中提取重要分段点的数量分布情况, 利用重要点组成的序列重新拟合原始时间序列, 为下一步数据挖掘提供基础。实验结果表明, 该方法能高效地提取出序列主要特征、拟合原始序列。  相似文献   

14.
直接采用风速、温湿压等气象参数原始时间序列对其进行短期预测、相似匹配、分类聚类等数据挖掘工作不但效率低下,而且会影响时间序列数据挖掘的准确性和可靠性。提出了一种简单快速的基于特征点的筛选算法对时间序列进行分段线性表示。对气象参数等时间序列进行实验,并就计算性能和拟合误差与另外一种序列分段算法进行了对比分析,结果表明该方法能有效地提取序列的主要形态,同时降低对于阈值的依赖,具有计算代价小、快速方便、通用性强等特点,在气象数据压缩上具有较好的应用前景。  相似文献   

15.
基于时间序列模式表示的异常检测算法*   总被引:2,自引:0,他引:2  
提出了一种基于时间序列的模式表示提取时间序列异常值的异常检测算法(PREOV).时间序列的模式表示本身就具有压缩数据、保持时间序列基本形态的功能,并且具有一定的除噪能力.在时间序列模式表示的基础上提取异常值,可以大大提高算法的效率和准确性,达到事半功倍的效果.在本算法中,还使用了一定的剪枝策略,使得算法的时间复杂度进一步降低.该算法计算简单、实现方便、无须训练,可以支持时间序列的动态增长.  相似文献   

16.
基于斜率提取边缘点的时间序列分段线性表示方法   总被引:7,自引:0,他引:7  
本文引入解析几何中的斜率,提出了一种新颖的基于斜率提取边缘点的时间序列分段线性表示方法SEEP。对于斜率变化范围比较集中的时间序列,SEEP表示方法有着非常好的效果,与以往的分段线性表示方法相比,SEEP表示方法与原始时间序列之间的拟合误差更小,而且要小很多;对于斜率变化范围比较大的时间序列,SEEP表示方法与原始时间序列之间的拟合误差,和以往的分段线性表示方法相比,也相差不大,并且SEEP表示方法计算简单,易于实现。算法的时间复杂度仅为O(n),  相似文献   

17.
周大镯  刘雷 《计算机工程》2009,35(16):45-47
在k-近邻局部异常检测算法的基础上,结合时间序列的分割方法,提出一种高效率的时间序列增量异常模式检测算法。将时间序列按序列重要点进行数据分割,利用局部异常检测方法检测出时间序列的异常模式。当插入一些新数据时,邻近分割模式发生变化,增量异常检测算法更新相应的最近邻模式。通过该算法可以高效率地发现时间序列的异常模式。  相似文献   

18.
基于重要点的时间序列线性分段算法能在较好地保留时间序列的全局特征的基础上达到较好的拟合精度。但传统的基于重要点的时间序列分段算法需要指定误差阈值等参数进行分段,这些参数与原始数据相关,用户不方便设定,而且效率和拟合效果有待于进一步提高。为了解决这一问题,提出一种基于时间序列重要点的分段算法——PLR_TSIP,该方法首先综合考虑到了整体拟合误差的大小和序列长度,接着针对优先级较高的分段进行预分段处理以期找到最优的分段;最后在分段时考虑到了分段中最大值点和最小值点的同异向关系,可以一次进行多个重要点的划分。通过多个数据集的实验分析对比,与传统的分段算法相比,减小了拟合误差,取得了更好的拟合效果;与其他重要点分段算法相比,在提高拟合效果的同时,较大地提高了分段效率。  相似文献   

19.
针对分段线性表示(即一阶线性函数表示)或分段常数表示(即零阶函数表示)在时间序列近似表示中拟合误差较大的问题,提出时间序列高阶函数分段表示方法。通过建立高阶函数候选集模型,利用拟合误差指标选取最优函数,为保证在分段点处连续,引入断点处约束条件;在分段点选取方式上,设定观测值变化阈值及分段区间阈值,保证压缩率的同时,保留重要点信息。实验结果表明,该算法相对于分段线性表示和分段常数表示,能更好地拟合原始序列。  相似文献   

20.
陈然  戴齐 《微机发展》2011,(9):103-106
基于重要点探测技术的时间序列线性分段算法能较好地保留序列的全局特征和拟合高精确度。传统的基于重要点时间序列分段算法,只能通过误差阈值来控制分段,该方法不能预计分段数量,不能适应后期要求分段数量一定的应用。提出一种基于序列重要点的时间序列固定分段数的分段算法—PLR_FPIP,该方法借用二叉树层次遍历的思路,重新调整原方法的分段次序,使用重要点组成的直线段近似描述时间序列,该方法能够在分段数量一定的情况下对时间序列分段。实验证明,该分段算法能在固定分段数的情况下反映时间序列的主体特征,算法简单快速,整体拟合误差小。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号