首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
多维时序数据中的相似子序列搜索研究   总被引:4,自引:0,他引:4  
由于动态时间弯曲距离较之欧氏距离有更好鲁棒性,因此被广泛用作时序数据相似子序列搜索研究领域中的相似性度量.在单一维度上的相似子序列搜索可能不能获得足够的匹配结果作为继续深入分析的依据,因此通过引入在多维数据分析中常用的数据立方体模型将相似子序列搜索问题扩展到了多维场景之下,从而在多个维度上得到搜索结果以获取更多有价值的知识.在此基础上利用数据立方体相邻层次单元间的相关性对基本的搜索算法进行了改进,在保证准确性的基础上提高了搜索效率.在真实网络安全数据集上的实验验证了所提方法的有效性.  相似文献   

2.
时序数据库中快速相似搜索的算法研究   总被引:1,自引:0,他引:1  
针对时间序列,本文提出了一种新的数据表示方法.该方法通过将时间序列分成若干段,并从每个分段中提取一个特征向量,从而用一个特征向量集作为该时间序列的逻辑表示.在此基础上,采用时间弯曲距离作为相似模型,提出了一种改进的KMP算法作为检索方法.此算法能够快速挖掘出时序数据库中与给定查询序列相似的所有(子)序列.该算法具有较高的效率.  相似文献   

3.
索引大规模时序数据库是高效时序搜索中的关键问题.提出了一种新颖的索引方案RQI, 它包括3种过滤策略: 即first-k过滤、索引低边界和上边界以及三角不等式修剪.基本的思想为首先运用Haar小波变换计算每个时序的小波系数,利用前面的k个小波系数形成一个最小边界矩阵,以利用点过滤方法;然后将预先计算每个时序的低边界特征和上边界特征存放到索引当中;最后采用三角不等式来修剪不相似的序列并确保没有漏报.同时提出了一种新的低边界距离函数SLBS和聚类算法CSA.通过CSA可保持索引良好的聚类特征以提高点过滤方法的效率,从而引入了一种更好的算法RQIC.在合成数据集和实时数据集的大量对比实验表明,RQIC是有效的且具备较高的查询效率.  相似文献   

4.
杨涛  李龙澍 《微机发展》2005,15(5):116-118,154
提出了一种能够对含有时间序列数据的数据库信息进行数据挖掘的方法。首先使用时间序列相似搜索方法对其中的时间序列数据进行模式发现,然后将时间序列数据转化为离散型数值,进一步使用粗糙集理论进行数据约简和规则提取。通过使用这种方法能够对含有时序数据的信息进行充分的挖掘并发现其中的规律。  相似文献   

5.
首先提出一种在时域上计算时序数据扩展距离的新算法,该算法时间复杂度为O(n×m),能够解决时序数据在Y轴上的漂移和伸缩后仍然保留相似性的问题;然后提出一种在频域上计算时序数据扩展距离和在长时序中搜索相似子序列的新算法,该算法时间复杂度仅为O(n×fc),效率很高,便于在线实现,而且同样能够适应时序数据扩展距离的定义;最后给出时序数据和线性加权时序数据的增量式DFT算法,可以对长时序的各个窗口进行增量式的降维,将传统的O(n×m×fc)工作改进成O(n×fc).  相似文献   

6.
提出了一种能够对含有时间序列数据的数据库信息进行数据挖掘的方法.首先使用时间序列相似搜索方法对其中的时间序列数据进行模式发现,然后将时间序列数据转化为离散型数值,进一步使用粗糙集理论进行数据约简和规则提取.通过使用这种方法能够对含有时序数据的信息进行充分的挖掘并发现其中的规律.  相似文献   

7.
研究基于时间序列相似搜索技术的煤矿瓦斯涌出分析新途径,提出基于PPR的煤矿瓦斯监测数据相似搜索方法。实验采用玉华煤矿的真实煤矿瓦斯监测数据,评价指标为信息损失量及相似查询效率。与基于离散傅立叶变换(DFT)和离散小波变换(DWT)的时间序列相似搜索算法的对比实验显示:在相同压缩比下,3种方法的信息损失相近;但是基于PPR的相似搜索算法的平均查询效率分别比基于DFT和基于DWT方法高32%和34%。因此PPR算法适合用于瓦斯监测数据相似搜索。  相似文献   

8.
索引空间相似性度量标准的精确度较低,在现有的相似时间子序列搜索算法中,后期处理过程中内外存之间数据的I/O时间较长。针对该问题,引用一种非线性维数约简技术,提出改进的相似时间子序列快速搜索算法,提高索引空间相似性度量标准的精确度,降低错误匹配的发生率。实验结果表明,该算法可有效降低重复估算的数据量,提高相似性搜索的效率。  相似文献   

9.
大规模时间序列数据库降维及相似搜索   总被引:4,自引:0,他引:4  
李爱国  覃征 《计算机学报》2005,28(9):1467-1475
提出一种基于分段多项式表示(PPR)的时间序列数据库相似查询的系统化方法.PPR是一类基于线性多项式回归的正交变换.用PPR变换索引时间序列数据在理论上具备非漏报性质.文中分析了PPR的计算复杂性以及查询阈值的下界,并提出了一种衡量时间序列相似查询算法之查询效率的定量指标.与基于离散傅立叶变换(DFT)和离散小波变换(DWT)的时间序列相似查询算法所作的对比实验表明,所提算法可以用低的索引结构维数获得高的查询效率.  相似文献   

10.
提前终止(Early Abandon)是在受限的相似搜索中的一项技术,在提高时间序列相似搜索的效率,减少冗余计算中取得成功应用.但是以往的工作中提前终止的效率往往都只是通过大量的实验测试来体现,而缺少一种理论化的方法.从理论上提出了一种对提前终止技术的实际效率的估算方法,采用统计概率的方式分析了提前终止技术在时间序列相似搜索中的效率,同时对理论结果进行了实验验证.实验结果表明,理论上的估计方法在一定程度上可以估算出提前终止的效率,为时间序列相似搜索的实际效率计算提供了理论工具.  相似文献   

11.
用基于移动均值的索引实现时间序列相似查询   总被引:2,自引:0,他引:2  
林子雨  杨冬青  王腾蛟 《软件学报》2008,19(9):2349-2361
提出了基于移动均值的索引来解决子序列匹配中的"ε-查询"问题:提出并证明了基于移动均值的缩距定理和缩距比关系定理,后者具有很好的"裁减"能力,可以在相似查询时淘汰大部分不符合条件的候选时间序列,从而达到快速相似查找的目的;引入了由Jagadish等人提出的BATON~*-树,并在此基础上适当修改,建立了MABI索引,极大地加快了相似查询过程;最后,在一个股票交易数据集上进行了实验,证明了MABI索引的良好性能.  相似文献   

12.
传统的基于相关反馈的时间序列相似性搜索是将正反馈和负反馈融合在一起创建新查询向量,这样并没有充分利用负反馈序列的价值,而且容易对初始查询向量进行过多的更改。本文提出一种基于反馈的时间序列相似搜索方法,将反馈的正相关和负相关序列分开处理,最终的相似序列不但要与正相关序列相似,还要尽量与负相关序列不相似。在UCR数据集上的实验结果表明,本文提出的相似搜索方法与传统的基于反馈的相似搜索方法相比,在某些数据集上可以提高查询的准确率以及查全率。  相似文献   

13.
分析了时间序列相似匹配搜索的研究现状,提出了基于序变换的时间序列相似匹配搜索方法。该方法能够实现趋势相似的不同长度子序列的快速匹配搜索,同时具有对匹配序列的平移、时间轴的伸缩不敏感、误警率低,以及易于建立索引等优点。实验结果证明了该方法的有效性。  相似文献   

14.
时序相似性搜索是时序数据分析最基本的操作之一,具有广泛的应用场景.针对现有分布式算法无法应对维度增长、扫描范围过大和相似性计算耗时的问题,提出一种面向键值存储的分布式时序相似性搜索方法KV-Search.首先对时序数据分块,并设计其键值存入键值数据库,解决了时序数据维度高且不断增长的问题;其次,基于切比雪夫距离计算其下...  相似文献   

15.
时间序列相似性分析方法研究   总被引:11,自引:0,他引:11  
在经典的时间序列相似分析方法基础上,论文讨论了一些有代表性的现代时间序列相似性分析方法,对其基本思想加以分析和提炼,总结了这些方法的优缺点,为时间序列分析研究提供了较为完整的成果概览。  相似文献   

16.
基于角点弯曲度的时间序列相似性搜索算法   总被引:2,自引:0,他引:2       下载免费PDF全文
张雪丽  牛强 《计算机工程》2011,37(15):37-39,54
针对基于点距离的时间序列相似性搜索算法鲁棒性较差的问题,提出一种面向形态的时间序列近似表示方法和相似性度量算法。算法不依赖于时间序列长度和领域知识。在充分利用时间序列时变特征的基础上,以角点为分界点,利用角点处的弯曲度提取时间序列的特征,近似表示时间序列。实验结果表明,该算法具有良好的平移和伸缩不变性及较好的鲁棒性,搜索能力更强。  相似文献   

17.
提出了一种基于相关反馈的微博相似主题时序查询方法。该方法通过考虑用户对不同查询结果是否满意的反馈情况,建立修改度量系数的目标函数,从而实现微博中体现用户兴趣的主题时序相似性计算,为用户提供更满意的相似主题时序查询结果。基于该方法设计了一个可视化的微博相似主题时序查询系统,在微博代表性网站-Twitter数据集上进行的实验,表明了该方法在微博背景下的相似主题时序查询中的有效性。  相似文献   

18.
时间序列相似性查找作为一种非平凡问题,大多数有效的求解方法都涉及到对原数据维度的简约。在有效地保持原序列中信息量的前提下,尽可能降低计算复杂度是算法的关键所在。通过讨论滑动窗口在时间序列相似性降维算法中的实际应用情况,从中发现一种自适应确定滑动窗口宽度的新方法。通过对时序特征值分布函数挖掘,发现时间序列中的有效特征点,进而确定一组合适的滑动窗口宽度;最后根据序列的变化情况来决定最优的滑动窗口宽度,对原数据维度进行简约。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号