共查询到20条相似文献,搜索用时 62 毫秒
1.
基于时间序列的相似子模式发现算法 总被引:4,自引:0,他引:4
基于时问序列的数据挖掘时,一般需要对时间序列离散化,再聚类成不同的子模式。已有的方法常忽略时间序列本身的位置和整体特征,并且计算量大。针对其不足,文中提出一种检索时间序列分段关键点的算法,以关键点为边界分段,使用形态距离测度和快速剪除的算法,高效简便地检索出相似子模式。 相似文献
2.
基于时间序列的数据挖掘时,一般需要对时间序列离散化,再聚类成不同的子模式。已有的方法常忽略时间序列本身的位置和整体特征,并且计算量大。针对其不足,文中提出一种检索时间序列分段关键点的算法,以关键点为边界分段,使用形态距离测度和快速剪除的算法,高效简便地检索出相似子模式。 相似文献
3.
相似时间序列的快速检索算法 总被引:10,自引:0,他引:10
在前人提出的扩展时序数据距离定义的基础上 ,首先提出一种在时域上计算时序数据距离的新算法 ,该算法时间复杂度为 O( n× m ) ,能够解决时序数据在 Y轴上的漂移和伸缩带来的问题 ;之后提出一种在频域上计算时序数据距离的新算法 ,该算法时间复杂度仅为 O( n× fc) ,效率很高 ,便于在线实现 ,而且同样能够解决时序数据漂移和伸缩的问题 ;本文还给出和证明了该算法的一个重要组成部分 :时序数据增量式的 DFT算法 相似文献
4.
带时间特征的序列模式挖掘算法TESP 总被引:4,自引:0,他引:4
引入序列模式时间特征的概念,并提出了一个带时间约束的序列模式挖掘算法,称做TESP(Time-enriched Sequential Pattern mining),该算法在找出模式的同时,也给出了序列模式的时间特征,并且允许用户在挖掘之前对模式的这些时间特征进行限制,提高了序列模式挖掘的灵活性和有用性。 相似文献
5.
时间序列的快速相似性搜索改进算法 总被引:1,自引:0,他引:1
This paper introduces a new method for finding all subsequences similar to a given time series sequence.The method takes into account noise ,offset translation and amplitude scaling. Based on a piecewise linear representa-tion, the speed is exceptionally fast. 相似文献
6.
非同步多时间序列中频繁模式的发现算法 总被引:8,自引:0,他引:8
从多个时间序列中发现频繁模式在实际应用中具有非常重要的价值.已知文献所提供的方法均假设多时间序列是同步的,但是,在现实世界中,这一条件并不总能满足,许多情况下它们是非同步的.提出了一个从非同步多时间序列中发现频繁模式的算法.该算法首先利用线性化分段表示法和矢量形态聚类实现时间序列的特征分割与符号化转换,然后通过将Agrawal关联模式发现算法的核心思想与时间序列最短实现表示方法相结合,实现了非同步多时间序列中多种结构频繁模式的发掘.与已有算法相比,该算法更简单、更灵活,并且不要求序列严格同步.实验结果证明了该算法的有效性. 相似文献
7.
8.
9.
10.
时序数据库中快速相似搜索的算法研究 总被引:1,自引:0,他引:1
针对时间序列,本文提出了一种新的数据表示方法.该方法通过将时间序列分成若干段,并从每个分段中提取一个特征向量,从而用一个特征向量集作为该时间序列的逻辑表示.在此基础上,采用时间弯曲距离作为相似模型,提出了一种改进的KMP算法作为检索方法.此算法能够快速挖掘出时序数据库中与给定查询序列相似的所有(子)序列.该算法具有较高的效率. 相似文献
11.
时序数据库中相似序列的挖掘 总被引:2,自引:0,他引:2
1 引言时间序列是指按时间顺序取得的一系列观测值,这里的“时间”具有广义坐标轴的含义,既可以指按时间的先后顺序排列的数据,也可以指按空间的前后顺序排列的随机数据。从经济到工程技术,从天文到地理和气象,几乎在各种领域都会遇到时间序列。例如某地区的逐月降雨量,其实际记录结果,按月份先后排列,便是一个时间序列。在科技飞速发展的今天,越来越多的时间序列信息被存储在计算机上,例如证券公司的计算机积累了大量的股票信息,商场的POS系统搜集了大量的销售信息,人造卫星观测的气象信息和科学仪器所检测到的大量生物、地矿等信息也都被存储在计算机上。 相似文献
12.
一种头肩像序列的人脸快速定位算法 总被引:2,自引:0,他引:2
该文根据视频应用的特点,结合人脸的肤色和特征部位几何分布特征,提出了一种应用于头肩像序列视频编码的快速人脸定位算法。实验表明,该方法定位速度快,误检率低,可以在实时系统中应用。 相似文献
13.
由于目前大多数入侵侦测系统均基于专家知识的手工译码而构建,其更新十分缓慢和昂贵。显然从审计数据挖掘得出的频繁模式可以作为可靠的入侵侦测模型。因此,针对这一问题,提出一个快速有效的并行算法,该算法提取用来描述每一网络连接特征的扩充集合,并获知准确捕获入侵行为和正常活动的频繁模式,从而使得模型构建和不断更新简单易行。 相似文献
14.
由于目前大多数入侵侦测系统均基于专家知识的手工译码而构建,其更新十分缓慢和昂贵。显然从审计数据挖掘得出的频繁模式可以作为可靠的入侵侦测模型。因此,针对这一问题,文章提出一个快速有效的并行算法,该算法提取用来描述每一网络连接特征的扩充集合,并获知准确捕获入侵行为和正常活动的频繁模式,从而使得模型构建和不断更新简单易行。 相似文献
15.
一种长序列线性相关及卷积的快速算法 总被引:1,自引:0,他引:1
随着多媒体通信和数字信号处理技术的快速发展,各种信号处理的方法及相关理论不断完善,其中两种基本方法——卷积和相关得到了广泛的应用.鉴于多媒体信号的数据量很大,如果直接用以上两种方法处理,计算量将会很大.文章通过对快速傅立叶变换(FFT)的算法原理分析,根据线性相关和卷积的数学特征及物理含义,针对长序列信号,提出了一种基于FFT的长序列快速相关及卷积算法,用C++进行了算法编程,在计算机上得到较好的实验效果,提高了运行速度,并结合算术傅立叶变换进行了改进. 相似文献
16.
时态数据挖掘是数据挖掘中一个日益重要的研究课题。本文针对时态数据中的多维关系模型,提出了一种新的时态数据建模算法。 相似文献
17.
18.
提出了满足滑动窗口、最大间隙、最小间隙、最大跨度四种时间参数限制的序列挖掘算法.算法通过划分不同的等价类分解搜索空间,利用时间连接实现模式的逐步增长,挖掘过程只需扫描一次序列数据库.由于序列嵌入的四种参数具有通用性,本算法不仅能发现以前相关算法所能发现的模式,还能发现其他算法所不能发现的模式。 相似文献
19.
A Subsequence Matching Algorithm that Supports Normalization Transform in Time-Series Databases 总被引:2,自引:1,他引:1
In this paper, an algorithm is proposed for subsequence matching that supports normalization transform in time-series databases. Normalization transform enables finding sequences with similar fluctuation patterns even though they are not close to each other before the normalization transform. Simple application of existing subsequence matching algorithms to support normalization transform is not feasible since the algorithms do not have information for normalization transform of subsequences of arbitrary lengths. Application of the existing whole matching algorithm supporting normalization transform to the subsequence matching is feasible, but requires an index for every possible length of the query sequence causing serious overhead on both storage space and update time. The proposed algorithm generates indexes only for a small number of different lengths of query sequences. For subsequence matching it selects the most appropriate index among them. Better search performance can be obtained by using more indexes. In this paper, the approach is called index interpolation. It is formally proved that the proposed algorithm does not cause false dismissal. The search performance can be traded off with storage space by adjusting the number of indexes. For performance evaluation, a series of experiments is conducted using the indexes for only five different lengths out of lengths 256512 of the query sequence. The results show that the proposed algorithm outperforms the sequential scan by up to 2.4 times on the average when the selectivity of the query is 10–2 and up to 14.6 times when it is 10–5. Since the proposed algorithm performs better with smaller selectivities, it is suitable for practical situations, where the queries with smaller selectivities are much more frequent. 相似文献