共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
时间序列相似性查找作为一种非平凡问题,大多数有效的求解方法都涉及到对原数据维度的简约。在有效地保持原序列中信息量的前提下,尽可能降低计算复杂度是算法的关键所在。通过讨论滑动窗口在时间序列相似性降维算法中的实际应用情况,从中发现一种自适应确定滑动窗口宽度的新方法。通过对时序特征值分布函数挖掘,发现时间序列中的有效特征点,进而确定一组合适的滑动窗口宽度;最后根据序列的变化情况来决定最优的滑动窗口宽度,对原数据维度进行简约。 相似文献
3.
在时间序列相似性问题中滑动窗口的确定 总被引:1,自引:0,他引:1
作为一个非平凡命题,大多数时间序列相似性查找方法都涉及到了对原数据的维度简约.在保持原序列中有效信息量的同时,尽量降低计算复杂度是这些算法的关键.讨论滑动窗口在时间序列相似性降维技术中的实际应用,从中发现确定自适应滑动窗口大小的一种新方法.通过对时序特征值分布函数的挖掘,发现时间序列中的若干有效点,从而确定一组合适的滑动窗口大小,并根据序列变化的来决定最佳的滑动窗口. 相似文献
4.
5.
一种时间序列快速分段及符号化方法 总被引:1,自引:0,他引:1
作为一类重要的复杂类型数据,时间序列已成为数据挖掘领域的热点研究对象之一.针对时间序列的挖掘通常首先需要将时间序列分段并转变为种类有限的符号序列,以利于进一步进行时间序列模式挖掘.针对当前的时间序列分段方法复杂度较大,效率不高等问题,本文提出了一种简单高效的基于拐点检测的时间序列分段方法,并且采用动态时间弯曲度量计算不等长子序列的相异度,最后运用层次化聚类算法实现子序列的分类及符号化.实验表明,本文所提出的方法切实可行,实验结果具有较为明显的物理意义. 相似文献
6.
7.
曹茸 《数字社区&智能家居》2009,(18)
分析了股票市场高度非线性的特点,总结了时间序列数据的分段算法,针对股票时间序列数据实现了基于斜率提取边缘点的分段表示方法,根据我国国内股票价格10%的停板限制,提出了考虑时间长度和停板规则的八元符号化表示方法。该方法既考虑了股票价格的涨幅因素,又考虑了时间长度,能有效的表示股票价格的涨跌和时间的关系,并给出理论分析和验证结果。 相似文献
8.
针对符号化聚合近似算法(SAX)中时间序列必须等长分割的缺陷,提出一种基于分割模式的时间序列符号化算法(SMSAX)。利用三角阈值法对随机抽样的时间序列进行特征提取,计算时间序列最大压缩比,将其作为时间窗宽提取分割点,进而求出时间序列的分割模式。利用得到的分割模式对时间序列进行分割降维,通过均值和波动率对分割后的子序列进行向量符号化。根据时间序列特征对其进行不等长分割,并加入波动率消除奇异点的影响。实验结果表明,SMSAX能获得比SAX更精确的结果。 相似文献
9.
序列模式发现是最重要的数据挖掘任务之一,并有着广阔的应用前景。针对静态数据库,序列模式挖掘已经被深入地研究,但针对基于数据流的序列模式挖掘的研究还不是十分深入。数据流有着无限性的特性,因此往往不能保存数据流中全部的数据,同时很多时候只对最近的时间段的序列模式感兴趣,提出一个有效的结合滑动窗口技术的挖掘序列模式的算法FPM-SW,算法利用到3个数据结构(PatternTable,CountTable和Ta-tree)来处理基于数据流的序列模式挖掘的复杂性问题。算法通过CountTable结构来保存以往的潜在频繁序列,考虑到在某些情况下CountTable占用内存过多,算法还结合了一种压缩CountTable技术来减少内存占用。FPM-SW的优点是可以最大限度地降低负正例的产生,实验表明FPM-SW具有较高的准确率。 相似文献
10.
符号化聚集近似是一种有效的时间序列数据离散化降维方法,为了扩展非等维符号化时间序列相似性度量的解决方案,提出了一种新方法。首先将关键点提取技术应用在符号化算法中对时间序列进行降维处理,然后利用文中提出的方法对非等长的时间序列进行局部等维处理,再符号化;最后采用不同的方法进行相似度对比计算。实验结果表明,这种方法是简单而有效的,并且使非等长符号化时间序列的相似性度量及聚类方法得到了拓展。 相似文献
11.
在通信网告警相关性分析中,针对传统时间窗口提取告警数据效率低的问题,提出了一种基于双约束滑动时间窗口的告警预处理方法.在双约束的条件下,滑动时间窗的窗口宽度和滑动步长能够根据告警序列的实际情况自动地调整,并选取时间段的中点作为参照点.实验证明,采用双约束滑动时间窗划分算法可以获得比传统方法更高的数据提取效率,并且能够有效去除噪声数据,非常适合于通信网告警数据的预处理. 相似文献
12.
13.
为提高对进化数据流的聚类质量及效率,改进了基于滑动窗口的数据流聚类算法,采用聚类特征指数直方图来支持数据处理,减少了直方图结构的维护数,并在复杂度、聚类效果上得到了进一步改善.理论及验证表明,与传统基于界标模型的聚类算法相比,优化算法可获得较好的工作效率、较小的内存开销和快速的数据处理能力,拓展了数据流挖掘技术的应用领域. 相似文献
14.
基于衰减滑动窗口数据流聚类算法研究 总被引:2,自引:0,他引:2
数据流具有数据流量大、流量连续且快速、难以存储和恢复等特性,其挖掘质量和效率是检验挖掘算法的重要标准.传统的数据流聚类挖掘算法是基于界标窗口、滑动窗口和衰减窗口模型,其算法的聚类质量较差,时间复杂度高等不足,就此类问题,研究一种滑动衰减窗口的数据流聚类算法,并对算法进行了设计与实现,有效的改善传统数据流算法聚类质量和时间效率的问题.仿真实验结果表明了该算法的有效性,达到了较满意的效果. 相似文献
15.
16.
17.
文章提出了一种新的用于磁敏传感器的车辆检测算法。算法首先将磁敏数据时间序列经过变长滑动窗口滤波预处理,由PLA抽取平滑后的时间序列特征,用于车辆检测,从而获得相关的交通信息。仿真实验表明,算法有效地减少了慢速行驶的大型车辆对检测结果的影响,保持了较高的准确率。 相似文献
18.
19.
分段线性表示是时间序列降维的有效方法,其关键在于分割点的确定。在时间序列分段线性表示的基础上,提出一种新的基于重要点的时间序列分割方法。与一般方法比较相邻三点关系不同的是,将时间窗扩展为前一重要点、待考察点和一个指定时间窗组成的区间,再通过比较数据点前后模式变化来确定重要点。通过与其他7种分割方法进行实验比较,证明该方法适应能力强,不但分割结果总体质量高,在压缩率相同时具有更小的拟合误差,而且能够有效滤除噪声,发现时间序列的模式特征。 相似文献