共查询到19条相似文献,搜索用时 62 毫秒
1.
时间序列的相似性度量是时间序列分析的基础工作之一,是进行相似匹配的关键。针对欧几里德距离描述分段趋势的不足和各种模式距离对应分段之间距离值的离散化问题,提出一种基于形态相似距离的时间序列相似性度量方法,标准数据集上完成的识别和聚类实验表明了该方法的可行性和有效性。 相似文献
2.
基于事件的时间序列相似性度量方法 总被引:2,自引:0,他引:2
为了在时间序列相似性度量过程中更好地体现用户的需求,提高相似性度量的准确度,提出了基于事件的时间序列相似性度量方法(SMBE)。首先将用户的需求定义为事件,将原始时间序列转化为事件序列;然后,构建了基于事件序列的相似性度量模型(SMBE),SMBE定义了不同事件序列中各元素之间的相似性,并构成相应的相似性矩阵,对相似性矩阵进行搜索得到最优路径的值作为序列之间的相似性度量;最后,提出了基于SMBE的聚类方法。实验表明,在参数设置合理的情况下,能获得接近0.90的聚类精度。 相似文献
3.
针对数据挖掘领域中时间序列的相似性度量问题,提出一种斜率复合偏离距离方法。以大量噪声的高维多元时间序列数据为目标,提出了一种基于斜率偏离度的时间序列相似性度量方法。该方法主要是在分段线性的基础上,基于角度和斜率进行偏离度计算,解决普通斜率距离度量的局限性,物理意义更为明确,实际度量更为准确。证明了斜率复合偏离的完备性和连续性,最后用仿真算例对算法的有效性进行了验证。 相似文献
4.
一、引言自然界以及我们社会生活中的各种事物都在运动、变化和发展着,将它们按时间顺序记录下来,我们就可以得到各种各样的“时间序列”数据。对时间序列进行分析,可以揭示事物运动、变化和发展的内在规律,对于人们正确认识事物并据此作出科学的决策具有重要的现实意义。 相似文献
5.
对于时间序列聚类任务而言,一个有效的距离度量至关重要.为了提高时间序列聚类的性能,考虑借助度量学习方法,从数据中学习一种适用于时序聚类的距离度量.然而,现有的度量学习未注意到时序的特性,且时间序列数据存在成对约束等辅助信息不易获取的问题.提出一种辅助信息自动生成的时间序列距离度量学习(distancemetric learning based on side information autogeneration for time series,简称SIADML)方法.该方法利用动态时间弯曲(dynamic time warping,简称DTW)距离在捕捉时序特性上的优势,自动生成成对约束信息,使习得的度量尽可能地保持时序之间固有的近邻关系.在一系列时间序列标准数据集上的实验结果表明,采用该方法得到的度量能够有效改善时间序列聚类的性能. 相似文献
6.
时间序列的夹角距离及相似性搜索 总被引:1,自引:0,他引:1
提出一种面向相似性搜索的时间序列近似表示和度量方法.在自适应分段线性表示的基础上,使用相邻线段间的夹角构成的角度序列近似表示时间序列,并给出夹角距离度量方法的概念和基本性质的证明过程.序列的夹角距离克服了用点距离度量相似性时鲁棒性差以及物理概念不明确等缺陷,而且具有平移和旋转不变性的突出优点.对人工数据和实际股票数据进行相似搜索,实验结果证明该方法的有效性. 相似文献
7.
面向相似性查询的时间序列距离度量方法述评 总被引:1,自引:0,他引:1
从一元时间序列和多元时间序列两个方面对当前提出的主要时间序列距离度量方法进行了述评.深入分析了各种算法的原理和特点,比较了算法对时间序列形变的支持情况以及时间复杂度.从客观上讲,各种算法之间并不具有绝对的优劣关系,每种算法的原理和特点各异,适用的问题领域也不一样.对于工程应用中选择时间序列距离度量方法具有指导意义,同时对于设计新的距离度量方法也具有参考价值. 相似文献
8.
9.
10.
针对时间序列的全序列聚类展开,提出一种新的相似性度量——全局特征,即从时间序列的统计分布特征、非线性和Fourier频谱转换等3个方面提取11个全局特征构建特征向量。利用特征向量来描述原时间序列,不仅保留了大部分原有的信息,还能加快聚类计算的速度。经过大量的实验验证表明,基于全局特征提取的相似性度量能得到合理的聚类结果,特别是对经济领域的时间序列效果更为明显。例举了2个数据进行实验,并从主观和客观两个角度对聚类结果进行评估。 相似文献
11.
针对时序动态数据挖掘算法有限的问题,充分考虑动态数据之间的依赖性,将隐马尔可夫模型和启发式聚类策略相结合实现对时序动态数据发展变化特征及规律的挖掘。首先,基于隐马尔可夫模型将时序数据转换到似然空间,并以对称性KL( Kullback-Leibler)距离来标识似然度的大小;其次,构建对称性KL距离转移矩阵,并借助分层聚类方法实现对时序动态数据变化模式的分类。通过将该方法应用于计算机网络专业职位需求变化规律的知识发现,挖掘出职位需求变化的五类模式。 相似文献
12.
13.
14.
孙梅玉 《计算机工程与应用》2012,48(20):11-17,22
在时间序列的GMBR表示的基础上,首次提出将基于距离和基于密度的时间序列检测方法结合,给出了时间序列模式异常的定义,并用“异常特征值”来衡量时间序列模式的异常程度.根据所提出的模式异常的定义,在强力搜索算法的基础之上提出了新的时间序列异常检测算法GMBR-DD (Grid Minimum Bounding Rectangle-Discords Detect),该算法将基于距离和基于密度的异常检测方法结合,能够高效地发现时间序列中的异常模式.通过三组实验数据,对提出的异常时间序列定义和时间序列的异常检测算法进行了验证,实验结果表明所提出的时间序列异常检测算法能够有效地发现时间序列的异常变动,为决策提供了很好的平台和有力的工具. 相似文献
15.
16.
17.
18.
时间序列子序列匹配作为时间序列检索、聚类、分类、异常监测等挖掘任务的基础被广泛研究。但传统的时间序列子序列匹配都是对精确相同或近似相同的模式进行匹配,为此定义了一种全新的具有相似发展趋势的序列模式——时间序列同构关系,经过数学推导给出了时间序列同构关系判定的法则,并基于此提出了同构关系时间序列片段发现的算法。该算法首先对原始时间序列进行预处理,然后分段拟合后对各时间序列分段进行同构关系判定。针对现实背景数据难以满足理论约束的问题,通过定义一个同构关系容忍度参数使实际时间序列数据的同构关系挖掘成为可能。实验结果表明,该算法能有效挖掘出满足同构关系的时间序列片段。 相似文献
19.
为了实现Web服务请求数据的快速聚类,并提高聚类的准确率,提出一种基于增量式时间序列和任务调度的Web数据聚类算法,该算法进行了Web数据在时间序列上的聚类定义,并采用增量式时间序列聚类方法,通过数据压缩的形式降低Web数据的复杂性,进行基于服务时间相似性的时间序列数据聚类。针对Web集群服务的最佳服务任务调度问题,通过以服务器执行能力为标准来分配服务任务。实验仿真结果表明,相比基于网格的高维数据层次聚类算法和基于增量学习的多目标模糊聚类算法,提出的算法在聚类时间、聚类精度、服务执行成功率上均获得了更好的效果。 相似文献