首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 218 毫秒
1.
时间序列异常模式的k-均距异常因子检测   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种基于k-均距异常因子检测时间序列异常模式的算法(K-MDOF)。该算法首先利用边缘权重因子提取时间序列模式表示的边缘点,然后通过提取每一段子模式的四个特征值:模式长度、模式高度、模式均值和标准差将时间序列映射到特征空间,最后利用k-均距异常因子在该特征空间中检测时间序列的异常模式。从模式的角度检测时间序列的异常行为弥补了点异常检测的个体行为局限性,提高了异常检测的效率和准确性,在仿真数据集和真实数据集上的实验结果都证明了在时间序列异常检测中模式异常定义的合理性以及算法的有效性。  相似文献   

2.
基于时态边缘算子的时间序列分段线性表示   总被引:2,自引:1,他引:1  
时间序列的分段线性表示算法通常基于单一的启发式规则,难以适用于不同数据特征的时间序列。借鉴了边缘算子的思想来提取时间序列的边缘点,提出了一种基于时态边缘算子的时间序列分段线性表示算法。在来自不同领域的公开数据集上进行的实验结果表明:与两种主要的分段线性表示算法相比,该算法具有更好的拟合性能,并且更为稳定,能够适用于各类不同数据特征的时间序列。  相似文献   

3.
基于插值边缘算子的时间序列模式表示   总被引:1,自引:0,他引:1  
借鉴数字图像领域中边缘算子的基本思想,提出一种基于插值边缘算子的时间序列分段线性表示方法(简称为IEO表示).该方法根据插值边缘算子中的两个子度量:边缘强度和插值误差相结合的度量标准来选取时间序列模式表示中每个子模式的边缘点(端点).时间序列的IEO表示不但可以压缩数据,还可以有效抑制噪声的影响,因而具有较强的适应性,可以适应不同的数据特征环境.  相似文献   

4.
分析了股票市场高度非线性的特点,总结了时间序列数据的分段算法,针对股票时间序列数据实现了基于斜率提取边缘点的分段表示方法,根据我国国内股票价格10%的停板限制,提出了考虑时间长度和停板规则的八元符号化表示方法。该方法既考虑了股票价格的涨幅因素,又考虑了时间长度,能有效的表示股票价格的涨跌和时间的关系,并给出理论分析和验证结果。  相似文献   

5.
时间序列的特征表示与相似性度量是时间序列数据挖掘的重要基础。针对现有的序列表示方法难以具体反映序列的形态变化趋势,导致相似度量结果不精确的问题,提出一种新的基于形态模式的相似性度量算法。该算法在分段线性表示的基础上,根据序列在不同时段的斜率变化情况,划分序列的分段形态模式并用特殊的字符进行表示,把时间序列转换成字符串序列,利用最长公共子序列方法计算字符串序列的距离作为时间序列之间的距离。最后通过实验验证该方法的有效性。理论分析和实验证明该方法对数据点的值不敏感,能够减少噪声的干扰,而且具有较高的准确性。  相似文献   

6.
通过计算某一点与其左右两相邻点斜率的比值确定出变化点,连接这些变化点,就得到一种基于斜率变化阈值的时间序列分段线性STC表示算法。来自航天器不同分系统的真实数据集实验表明,使用STC算法作为航天器测试时间序列的模式表示方法,与其他分段线性表示算法相比,该方法具有算法简单、拟合程度高和适应能力强的特点。  相似文献   

7.
基于斜率提取边缘点的时间序列分段线性表示方法   总被引:7,自引:0,他引:7  
本文引入解析几何中的斜率,提出了一种新颖的基于斜率提取边缘点的时间序列分段线性表示方法SEEP。对于斜率变化范围比较集中的时间序列,SEEP表示方法有着非常好的效果,与以往的分段线性表示方法相比,SEEP表示方法与原始时间序列之间的拟合误差更小,而且要小很多;对于斜率变化范围比较大的时间序列,SEEP表示方法与原始时间序列之间的拟合误差,和以往的分段线性表示方法相比,也相差不大,并且SEEP表示方法计算简单,易于实现。算法的时间复杂度仅为O(n),  相似文献   

8.
裁剪表示是时间序列降维表示研究领域中一种重要的数据驱动表示方法,该类方法将原始时间序列数据转换为一组由0和1组成的序列。然而,传统裁剪表示方法忽略了时间序列中数据点对序列趋势变化的影响,同时无法自定义降维表示后的压缩率。为了解决以上问题,提出了一种基于核转折点的裁剪表示方法KTPC,并基于KTPC表示方法提出了一种高效的时间序列异常检测算法KTPC-AD。所提方法按照指定的压缩率寻找时间序列中的核转折点,将时间序列转换为由核转折点裁剪表示形成的一组0和1序列,利用KTPC-AD算法计算时间序列的异常得分,最终获得异常序列。实验结果表明,KTPC方法具有较高的表示效率,基于KTPC表示的时间序列异常检测算法不仅降低了异常检测的时间复杂度,同时有效提升了异常检测精度。  相似文献   

9.
分段线性表示是时间序列降维的有效方法。在总结分析序列趋势变化特点的基础上,提出了一种基于趋势转折点的时间序列分段线性表示算法。首先定义了趋势转折点作为时间序列分段点的备选集,以点到区域的距离度量趋势转折点的重要性,再根据给定的阈值选择重要趋势转折点作为分段点,对时间序列进行分段线性表示。通过与其他6种方法进行实验比较,结果表明:所提方法在具有较好的拟合质量和适应能力以及对转折点明显的序列,都表现出较强的抗噪声干扰能力。  相似文献   

10.
时间序列异常检测   总被引:3,自引:0,他引:3  
在k-近邻局部异常检测算法的基础上,结合时间序列的分割方法,提出了一种高效的时间序列异常检测算法。该算法首先把序列重要点作为数据的分割点,对时间序列数据进行高比例压缩;其次利用局部异常检测方法检测出时间序列中的异常模式。通过心电图(ECG)数据实验验证了算法的有效性和合理性。  相似文献   

11.
分段线性表示是时间序列降维的有效方法,其关键在于分割点的确定。在时间序列分段线性表示的基础上,提出一种新的基于重要点的时间序列分割方法。与一般方法比较相邻三点关系不同的是,将时间窗扩展为前一重要点、待考察点和一个指定时间窗组成的区间,再通过比较数据点前后模式变化来确定重要点。通过与其他7种分割方法进行实验比较,证明该方法适应能力强,不但分割结果总体质量高,在压缩率相同时具有更小的拟合误差,而且能够有效滤除噪声,发现时间序列的模式特征。  相似文献   

12.
为了有效地检测发动机试车实验中性能参数发生的异常,提出一种基于时间序列数据挖掘的发动机故障检测方法。通过基于形态特征的时间序列特征表示方法,将发动机参数时 间序列转化为符号序列,再根据符号语义对发动机参数序列实现稳态特征和过渡态特征识别。同时,根据稳态序列的数据特征,利用基于统计特征的时间序列相似性度量结合最不相似模式发现方法实现发动机的故障检测。数值实验结果表明,与传统方法相比,本文方法能够有效地对发动机性能参数进行故障检测,并且具有较强的鲁棒性。  相似文献   

13.
飞机故障预警对于飞行安全具有重要意义,而实现故障预警的重要前提是要建立正确的故障模型。针对这个问题,结合飞行数据的特殊性,提出了一种基于改进插值边缘算子的飞机故障模型表示方法。该方法首先计算出飞行数据序列上各点的边缘强度和插值误差,运用改进的插值边缘算子算法选取出飞机故障模型的边缘点。实验结果表明,该方法不仅保留了飞行数据序列的主要形态,而且也保留了重要极小值点,具有更小的拟合误差,达到正确建立故障模型的目的。  相似文献   

14.
一种基于信息熵的时间序列分段线性表示方法   总被引:1,自引:0,他引:1  
针对部分时间序列具有高维、大数据量及数据更新速度较快的特点, 导致在原始时间序列上难以进行数据挖掘的问题, 提出一种基于信息熵的时间序列分段线性表示方法——PLR_IE。该算法利用信息熵作为评判重要点数量的性能指标, 从序列中提取重要分段点的数量分布情况, 利用重要点组成的序列重新拟合原始时间序列, 为下一步数据挖掘提供基础。实验结果表明, 该方法能高效地提取出序列主要特征、拟合原始序列。  相似文献   

15.
时间序列的表示是时序数据挖掘的一个重要问题.重要点的分段表示法(IP)是目前应用最为广泛的时间序列特征提取方法之一,具有较好的数据压缩和去除噪声能力,但参数的选择对时间序列的近似效果有很大的影响而且难以找到重要的转折点.基于多分辨率的重要点检索分段方法(MIP)也是一种时间序列特征提取方法,该方法能很好地近似时间序列,但检索次数难以确定且运行效率比较低.为了改进以上两种方法的缺陷,提出了一种新的基于重要点的多分辨率检索表示法(MRIP).实验结果表明,与基于重要点分段方法相比,该方法误差更小,具有很好的压缩率,并能去除噪音干扰;与基于多分辨率的重要点检索分段方法相比,能较好地确定检索次数的范围,在近似效果相当的情况下,运算效率更高.  相似文献   

16.
时间序列数据的特征表示方法是时间序列数据挖掘任务的关键技术,符号聚合近似表示(SAX)是特征表示方法中比较常用的一种。针对SAX算法在各序列段表示符号一致时无法区分时间序列间的相似性这一缺陷,提出了一种基于始末距离的时间序列符号聚合近似表示方法(SAX_SM)。由于时间序列有很强的形态趋势,因此文中提出的方法选用起点和终点来表示各个序列段的形态特征,并使用各序列段的形态特征和表示符号来近似表示时间序列数据,以将其从高维空间映射到低维空间;然后,针对起点和终点构建始末距离来计算两序列段间的形态距离;最后, 结合 始末距离和符号距离定义一种新的距离度量方式,以更客观地度量时间序列间的相似性。理论分析表明,该距离度量满足下界定理。在20组UCR时间序列数据集上的实验表明,所提SAX_SM方法在13个数据集中获得了最高的分类准确率(包含并列最大的),而SAX只在6个数据集中获得了最高的分类准确率(包含并列最大的),因此SAX_SM具有比SAX更优的分类效果。  相似文献   

17.
直接采用风速、温湿压等气象参数原始时间序列对其进行短期预测、相似匹配、分类聚类等数据挖掘工作不但效率低下,而且会影响时间序列数据挖掘的准确性和可靠性。提出了一种简单快速的基于特征点的筛选算法对时间序列进行分段线性表示。对气象参数等时间序列进行实验,并就计算性能和拟合误差与另外一种序列分段算法进行了对比分析,结果表明该方法能有效地提取序列的主要形态,同时降低对于阈值的依赖,具有计算代价小、快速方便、通用性强等特点,在气象数据压缩上具有较好的应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号