首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
基于互关联后继树的时序模式挖掘   总被引:1,自引:0,他引:1  
时间序列是现实生活中常见的数据形式之一.在时间序列中发现频繁模式是分析时间序列变化规律的一项重要任务本文提出一种基于互关联后继树模型的时间序列频繁模式发现方法.该方法依据序列重要点进行分段,引人相对斜率值并结合领域知识将序列符号化,在此基础上提出一种互关联后继树的新型挖掘算法,实现了时序频繁模式的发现理论与实验表明,该方法简单、直观、高效,具有实用价值.  相似文献   

2.
基于云模型的时间序列分段聚合近似方法   总被引:3,自引:0,他引:3  
李海林  郭崇慧 《控制与决策》2011,26(10):1525-1529
针对时间序列数据的高维特性,提出一种基于云模型的时间序列分段聚合近似方法.利用云模型的熵评判分段聚合后各子序列的数据稳定性,选取稳定性最弱的子序列再分段聚合,最终得到云模型序列,同时给出了云模型序列的相似性度量.该方法对时间序列能够有效降维,并能够自适应地识别和描述其基本特征.实验结果表明,数据压缩较大时,所提出方法能够较好地保证近似的准确性,并提高时间序列数据挖掘的效率.  相似文献   

3.
针对经典动态规划分段算法只适用于低维时间序列的问题,提出一种基于因子模型和动态规划的多元时间序列分段方法.首先利用增量聚类自动对变化趋势相似的变量序列进行聚类,然后引入动态因子模型使降维后的低维多元时间序列能够最大限度反映原始多元时间序列的整体变化趋势,最后利用动态规划在低维多元时间序列的架构上实现高维多元时间序列的分段.实验结果表明,所提方法对变量个数较多的多元时间序列数据具有良好的分段效果.  相似文献   

4.
王玲  朱慧 《控制与决策》2021,36(1):115-124
针对传统的Gath-Geva(G-G)模糊分段方法需要人为设置参数,对高维时间序列分段效率低的问题,提出一种基于核主元分析(KPCA)和G-G聚类的多元时间序列模糊分段方法.首先,该算法利用KPCA方法对多元时间序列进行特征提取,去除冗余及无关变量的影响;然后,通过近邻传播算法(AP)得到分段数目的上界;最后,将时间信息考虑在内,基于所提出的MDBI有效值指标以及G-G模糊聚类在低维多元时间序列上实现多元时间序列的最佳模糊分段.实验结果表明,所提出算法可以快速有效地检测出时间序列的某种突然和渐近变化的趋势,在准确性和运行效率方面均得到了提升.  相似文献   

5.
针对目前已有的时间序列数据分段方法多侧重于静态数据的分段现状,根据时间序列流数据的变化情况,分析数据流的状态,提出一种有限自动机的分段方法,它通过分析时间序列流中数据所处的状态,进而发现其中的变化点,并以变化点作为段的两端,从而完成时间序列的分段。实验表明,这种方法能够有效地对高速时间序列流进行分段,保证了分段的效果和质量。  相似文献   

6.
现有的多元时间序列相似性度量方法 难以平衡度量准确性和计算效率之间的矛盾.针对该问题,首先,对多元时间序列进行多维分段拟合;然后,选取各分段上序列点的均值作为特征;最后,以特征序列作为输入,利用动态时间弯曲算法实现相似性度量.实验结果表明,所提出方法参数配置简单,能够在保证度量准确性的前提下有效降低计算复杂度.  相似文献   

7.
杨艳林  叶枫  吕鑫  余霖  刘璇 《计算机科学》2016,43(2):245-249
水文时间序列相似性挖掘是水文时间序列挖掘的重要方面,对洪水预报、防洪调度等具有重要意义。针对水文数据的特点,提出了一种基于DTW聚类的水文时间序列相似性挖掘方法。该方法先对数据进行小波去噪、特征点分段以及语义划分,再基于DTW距离对划分后的子序列做层次聚类并符号化;然后根据符号序列间的编辑距离筛选候选集;最后通过序列间的DTW距离进行精确匹配,获取相似水文时间序列。以滁河六合站的日水位数据进行实验,结果表明,所提方法能够有效地缩小候选集,提高查找语义相似的水文时间序列的效率。  相似文献   

8.
由于时间序列数据具有高维性等特征,不易直接进行挖掘.在对时间序列数据进行挖掘之前通常先进行特征表示达到降维的目的,分段聚合近似表示(PAA)是特征表示方法中比较常用的一种,针对PAA算法对每一区间有平均对待的缺点,提出一种采用小波熵的时间序列分段聚合近似表示,将小波熵运用到PAA算法的改进中,把某一区间内的小波能量熵值作为判评区间复杂度的指标,按各区间内小波熵值的比重分配各区间内分段数,实现对复杂区间详细描述,对相对平稳区间粗略逼近,利用matlab平台仿真证明,上述方法在压缩比相同的情况下比PAA方法更好地拟合原始序列,不仅能对时间序列有效地降维,而且能使近似更加精确,进而实现时间序列数据挖掘效率的提高.  相似文献   

9.
随着计算机软、硬件的进步,人们利用信息技术产生和搜集数据的能力大幅度提高.作为数据挖掘的重要研究课题之一,时间序列的挖掘与预测近几年发展迅速.本文时时间序列的分段线性化表示进行了研究,采用新的分段线性化表示方法建立了序列相似性度量准则,弥补了以往度量准则对时间轴上伸缩的变化敏感的问题.新的表示方法和相似性度量准则使时间序列数据更容易应用传统的数据挖掘方法.  相似文献   

10.
针对轨迹数据采集手段日趋多样化,导致时空模式挖掘的预处理环节难以采用单一、固定的分段粒度来聚类挖掘的问题,提出了一种基于“极大稳定分段阈值”的时空模式挖掘方法。算法在预处理环节自适应调整多个分段阈值对轨迹进行分段,在模式挖掘阶段利用时空模式的空间连通特性来提升挖掘效率,并解决了多阈值分段导致的序列模式支持度重复计数问题。实验表明该方法提升了挖掘过程的鲁棒性,简化了参数调节过程,具有较强的实用性。  相似文献   

11.
时序规则发现及其算法   总被引:3,自引:0,他引:3  
该技术先把要考察的时间序列转换成子时间序列数据,然后对这些子时间序列数据进行挖掘, 从中提取关联规则。给出了时间序列关联规则的挖掘算法, 并举例说明该算法是有效的和可行的。  相似文献   

12.
陆怡  王鹏  汪卫 《计算机工程》2022,48(10):88-94
时间序列是对某个事物或系统进行连续同间隔测量得到的数值序列,挖掘时间序列中潜在的语义信息对于发现系统运行规律或识别系统突发异常至关重要,然而目前多数时间序列语义挖掘算法对于时间序列数据特征有一定的约束条件,难以处理海量且特征各异的时间序列数据。针对该问题,提出一种基于子序列相似性的时间序列语义挖掘算法。通过计算子序列的相似性,将时间序列分割成片段序列进行两级聚类,识别出时间序列中潜在的物理状态。引入基于概率的迭代模式,根据候选分段情况动态调整子序列被选为参考子序列的概率,保证参考子序列涵盖全部物理状态。实验结果表明,该算法在PAMAP、Barbet等5个真实数据集上的识别准确率均超过90%,相比于FLUSS、pHMM、AutoPlait算法具有更高的识别准确率与运行效率以及更强的通用性。  相似文献   

13.
时间序列模糊关联规则的挖掘   总被引:3,自引:0,他引:3  
对于许多复杂系统产生的时间序列,研究序列的局部行为和局部关联特征往往比原来的研究系统全局性模型具有明显的优势。为研究时间序列内部或时间序列间局部形态的关联特征,文章借助模糊集来软化时间序列属性论域的划分边界从而研究时间序列局部形态的模糊关联规则、规则可信度和规则的评价方法。实际算例显示了算法的有效性。  相似文献   

14.
基于序列重要点的时间序列分割   总被引:7,自引:1,他引:6       下载免费PDF全文
时间序列包含的数据量大、维数高、数据更新快,很难直接在原始时间序列上进行数据挖掘。该文提出一种基于序列重要点(SIP)的时间序列分割算法——PLR_SIP,用SIP组成的直线段近似描述时间序列。将SIP作为时间序列的分割点,反映时间序列的主要特征,降低时间序列的维数,使整体误差达到最小。  相似文献   

15.
时间序列的相似性度量是时间序列数据挖掘的研究基础,为数据挖掘任务的效率和准确度提供可靠的保障。提出一种时间序列的层次分段及相似性度量方法,方法首先识别时间序列中的极值点,依据极值点的特征对时间序列进行分层次分段,并以此为基础,通过定义新的距离公式来度量时间序列间的相似性。使用新提出的相似性度量方法对时间序列进行聚类计算,实验结果表明,该方法能够有效地度量时间序列间的相似性,聚类效果明显,具有较好的实用性和良好的应用前景。  相似文献   

16.
Streaming time series segmentation is one of the major problems in streaming time series mining, which can create the high-level representation of streaming time series, and thus can provide important supports for many time series mining tasks, such as indexing, clustering, classification, and discord discovery. However, the data elements in streaming time series, which usually arrive online, are fast-changing and unbounded in size, consequently, leading to a higher requirement for the computing efficiency of time series segmentation. Thus, it is a challenging task how to segment streaming time series accurately under the constraint of computing efficiency. In this paper, we propose exponential smoothing prediction-based segmentation algorithm (ESPSA). The proposed algorithm is developed based on a sliding window model, and uses the typical exponential smoothing method to calculate the smoothing value of arrived data element of streaming time series as the prediction value of the future data. Besides, to determine whether a data element is a segmenting key point, we study the statistical characteristics of the prediction error and then deduce the relationship between the prediction error and the compression rate. The extensive experiments on both synthetic and real datasets demonstrate that the proposed algorithm can segment streaming time series effectively and efficiently. More importantly, compared with candidate algorithms, the proposed algorithm can reduce the computing time by orders of magnitude.  相似文献   

17.
针对现有模糊信息粒化方法构建的高层信息粒不能完全包含底层数据信息、预测时间范围受限等问题,提出了一种插值梯形模糊信息粒化方法来预测瓦斯浓度趋势。对原始瓦斯浓度时间序列进行离散化形成若干子序列,计算每个子序列窗口的最大值与最小值形成梯形上沿的边界,通过对每个子序列窗口数据进行插值计算,形成新的瓦斯浓度时间序列窗口,对新的瓦斯浓度时间序列窗口采用数据遍历寻优的方式计算梯形下沿的边界,进而形成瓦斯浓度粒化区间序列。针对现有评价方法无法准确评价信息粒化效果的问题,提出了一种基于权值的粒化评价方法,通过加权均方根误差对粒化效果进行整体评价。实验结果表明,通过该方法对信息进行粒化的效果明显优于现有模糊粒化方法,并且粒化效果不随粒化窗口的增大而减小,具有较高的稳定性与鲁棒性。  相似文献   

18.
时间序列相似性定义延拓   总被引:1,自引:0,他引:1       下载免费PDF全文
时间序列相似性定义没有一个明确的、统一的表述方法,造成了研究上的困难。将研究序列分解为多个与参照序列等维的子序列,把问题转化为研究子序列与参照序列的相似性。选择满足保范同构的线性变换算子对子序列和参照序列进行变换,以降低直接计算的复杂度。利用集合理论对相似关系进行了宏观描述,用子序列与参照序列变换前后向量差的范数定义序列相似性度量函数,将相似性度量进行了统一。研究结果为基于傅立叶变换和小波变换研究时间序列的相似性提供了理论依据。  相似文献   

19.
针对时间序列片段归类时在边界状态上存在不确定性的问题,提出一种软化边界的方法.该方法对时间序列记录集属性序列进行滑窗以及正规化处理后用模糊聚类方法聚类,使样本个体不是简单地归于单个代表形态.通过样本点的隶属度计算关联规则的支持度和可信度,使这2个重要指标的计算更精确,并采用一种基于隶属度的J-measure测度对规则有...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号