首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
针对以往时间序列分类技术忽略了数据间自相关性对算法影响的不足,通过对传统决策树算法进行扩展,提出了序列熵和序列对信息增益的概念,并以此构建针对时间序列的决策树(Time Series Decision Tree,简称TSDT)。在此基础上,以TSDT为基分类器,通过动态分类器集成技术,提出了时间序列动态集成分类算法(En-TSDT)。在UCR数据集上的实验表明,与目前应用最广泛的1NN-DTW分类器相比,En-TSDT克服了时间序列数据的自相关性对分类算法的影响,具有更好的分类性能和鲁棒性。  相似文献   

2.
赵超  王腾江  刘士军  潘丽  嵇存 《软件学报》2020,31(3):763-777
基于Shapelet的时间序列分类算法具有可解释性,且分类准确率高、分类速度快.在这些算法中,Shapelet学习算法不依赖于单一分类器,能够学习出不在原始时间序列中的Shapelet,可以取得较高的分类准确率,同时还可以保证Shapelet发现和分类器构建同时完成;但如果产生的Shapelet过多,会增加依赖参数,导致训练时间太长,分类速度低,动态更新困难,且相似重复的Shapelet会降低分类的可解释性.提出一种选择性提取方法,用于更精准地选择Shapelet候选集,并改变学习方法以加速Shapelet学习过程;方法中提出了两个优化策略,通过对原始训练集采用时间序列聚类,可以得到原始时间序列中没有的Shapelet,同时在选择性提取算法中加入投票机制,以解决产生Shapelet过多的问题.实验表明,该算法在保持较高准确率的同时,可以显著地提高训练速度.  相似文献   

3.
Shapelet序列分析为时间序列分类提供了一种快速分类的方法,但Shapelet序列抽取速度很慢,限制了它的应用范围。为了加快 Shapelet 序列的提取,提出了一种基于主成分分析的改进方法。首先运用主成分分析法(PCA)对时间序列数据集进行降维,采用降维后的数据表示原数据,然后对降维后的数据提取出最能代表类特征的Shapelet序列。实验结果表明:本方法在保证分类准确率的前提下,提高了运算速度。  相似文献   

4.
时间序列分析在流程企业中的应用研究   总被引:1,自引:0,他引:1  
该文采用数据挖掘中的时间序列模式对流程企业中的实际运行数据进行分析,首先采用模糊理论对实际数据进行处理,找出偏离常规运行状态但未到报警界限的参数点并模糊化,然后采用时间窗对参数离散处理,划分时间间隔得到时间序列数据库。然后对传统的Apriori算法进行改进,提出了基于关联规则的时间序列分析算法并编程实现,起到了对设备故障预警监控的作用。  相似文献   

5.
樊卓  汪毓铎 《计算机仿真》2021,38(1):336-339,365
针对物联网中多用户相似源敏感信息检索方法运算速度慢、结果质量较差问题,提出一种物联网多敏感信息同源检索算法。准确分析物联网各应用层,构建隐层的3层BP神经网络模型,引入动态因子的学习算法,结合多维仿生信息理论的点同源连续性规则,推导出多敏感信息同源相似度特征,排序信息同源相似度特征的相关性级别并输出,最终完成物联网多敏感信息同源检索。实验结果表明:所提方法运算时间较短,能够实现高效的多敏感信息同源检索,且用户对检索结果的满意度较高,提高了物联网多敏感信息同源检索的结果质量。  相似文献   

6.
针对传统的时间序列线性预测算法对时间序列的线性程度要求高,而非线性方法一般建模复杂且计算量大,提出了一种基于趋势点状态模型的时间序列预测算法.该算法无须考虑时间序列是否具有显著线性特征,通过序列间耦合度挖掘时间序列上的相似子序列,找出相对应的相似序列趋势点,建立趋势点状态模型并求出预测值.算法建模简单,复杂度较低.通过模拟实验,结果表明该算法性能良好,尤其对具有周期性的时间序列预测精度很高.  相似文献   

7.
Shapelet是一种具有辨识性的时间序列子序列,通过识别局部特征达到对时间序列准确分类的目的。原始shapelet发现算法效率较低,大量工作关注于提高shapelet发现的效率。然而,对于带有趋势变化的时间序列,采用典型的时间序列表示方法进行shapelet发现,容易造成序列中趋势信息的丢失。为了解决时间序列趋势信息丢失的问题,提出一种基于趋势特征的多样化top-k shapelet分类方法:首先采用趋势特征符号化方法对时间序列的趋势信息进行表示;然后针对序列的趋势特征符号获取shapelet候选集合;最后通过引入多样化top-k查询算法从候选集中选取k个最具代表性的shapelets。在时间序列的分类实验中,与传统分类算法相比,所提方法在11个数据集上的分类准确率均有提升;与FastShapelet算法相比,提升了运行效率,缩短了算法的运行时间,并在趋势信息明显的数据上效果显著。结果表明,所提方法能有效提高时间序列的分类准确率,提升算法运行效率。  相似文献   

8.
闫伟  张浩  陆剑峰 《计算机应用》2005,25(7):1584-1586
采用数据挖掘中的时间序列模式对流程企业中的运行数据进行分析,首先采用模糊理论对实际数据进行处理,找出偏离常规运行状态但未到报警界限的参数点,然后采用时间窗对参数离散处理,划分时间间隔得到时间序列数据库。采用TimeSeq_PrefixSpan算法并编程实现,得到了按次序排列且有时间间隔的异常参数点对设备故障影响的规则,起到了对设备故障预警监控的作用。  相似文献   

9.
数据挖掘算法过程中对客户行为的实时性是分析客户网络消费行为的重要要素之一,但是Prefixspan数据挖掘算法挖掘过程中并未对此问题予以考虑,因此,在时间间隔序列模式概念的基础上,提出了一种基于时间间隔和点击量的Prefixspan改进算法。在该算法中,引人了频繁度和时间属性的概念,并加入了时间间隔和点击量等要素,从而使挖掘到的信息具有实时性的特点,并且提高了对挖掘对象的侧重性。通过实验验证,与原来的Prefixspan算法相比较后表明,改进算法用于具有时间特性的数据集时获得的挖掘结果更精确,挖掘效率得到了有效的提高。  相似文献   

10.
丁剑  王树英 《计算机科学》2016,43(5):257-260, 293
根据时间序列数据维度高、实值有序、数据间存在自相关性等特点,对时间序列分类过程进行研究。研究了当前比较流行的时间序列分类方法;从图像处理的角度出发,提出了一种将图片信息转化为时间序列数据的ITTS方法。shapelets作为最能够表示一条时间序列的子序列,随着时间的推移,这个特征序列可能会动态地发生变化。基于这样的思想,提出了一种基于动态发现shapelets的增量式时间序列分类算法IPST。该算法能够较好地动态发现当前最优的k个shapelets,从而提高时间序列分类的准确度。 得到 的shapelets集合还可以与多个传统的分类器结合,从而获得更佳的分类效果。  相似文献   

11.
针对基于shapelets转换的时间序列分类算法因shapelets候选集中存在大量相似序列而造成耗时过长的问题,提出了一种基于LSH的shapelets转换方法(Locality Sensitive Hashing Shapelets Transform,LSHST),提出一种局部敏感哈希函数(LSH)的改进算法,对原始子序列候选集进行逐级过滤筛选,快速挑选出形态上具有代表性的shapelets集合,计算集合中shapelets的质量,采用覆盖的方法确定将要进行转换的shapelets,进一步减小shapelets的数量,进行shapelets转换。实验表明,与Shapelet Transform(ST)、ClusterShapelets(CST)和Fast Shapelet Selection(FSS)算法相比,LSHST在分类精度上最高提升了20.05、19.9和16.52个百分点,在时间节省程度上最高达8 000倍、16 000倍和8.5倍。  相似文献   

12.
高亮  孙卫 《计算机应用研究》2012,29(9):3255-3258
针对不确定信息的相似性度量方法无法充分反映信息之间的关联情况,提出了直觉模糊集关联趋势分析法(RTIFS法)。利用直觉模糊集之间的距离表示不确定信息的差别,通过区间数与直觉模糊集之间的等价关系,利用区间数的距离计算直觉模糊集的关联度,最后应用集对分析法对序列间的关联趋势进行分类。RTIFS法将关联度计算的范围推广到不确定信息环境下,并给出多特征序列关联趋势的分类结果。实验结果表明,RTIFS法的分类准确率较高,算法运行时间短。  相似文献   

13.
在不确定环境下,决策环境的复杂性使决策信息并非完全精确,同时也可能使决策信息存在着时序上的动态变化性。在广义模糊软集的基础上提出了时序广义模糊软集,并定义其并运算、交运算和数乘运算。针对不同时间点决策信息的相互关联性和不同属性间的内在联系,根据几何Bonferroni平均算子(GBM算子)与S范数,提出了时序广义模糊软集几何加权Bonferroni平均算子(TGFSSGBM算子),并证明了其相关性质,在此基础上提出了考虑不同决策时间点权重的TGFSSGWBM算子。最后,构建了基于TGFSSGWBM算子的时序广义模糊软集决策模型,算例分析以及不同算子间的比较分析验证了该决策模型的可行性和有效性。  相似文献   

14.
针对股票、基金等大量时间序列数据的趋势预测问题,提出一种基于新颖特征模型的多时间尺度时间序列趋势预测算法。首先,在原始时间序列中提取带有多时间尺度特征的特征树,其刻画了时间序列,不仅带有序列在各个层次的特征,同时表示了层次之间的关系。然后,利用聚类挖掘特征序列中的隐含状态。最后,应用隐马尔可夫模型(HMM)设计一个多时间尺度趋势预测算法(MTSTPA),同时对不同尺度下的趋势以及趋势的长度作出预测。在真实股票数据集上的实验中,在各个尺度上的预测准确率均在60%以上,与未使用特征树对比,使用特征树的模型预测效率更高,在某一尺度上准确率高出10个百分点以上。同时,与经典自回归滑动平均模型(ARMA)模型和PHMM(Pattern-based HMM)对比,MTSTPA表现更优,验证了其有效性。  相似文献   

15.
Shapelets are discriminative subsequences of time series, usually embedded in shapelet-based decision trees. The enumeration of time series shapelets is, however, computationally costly, which in addition to the inherent difficulty of the decision tree learning algorithm to effectively handle high-dimensional data, severely limits the applicability of shapelet-based decision tree learning from large (multivariate) time series databases. This paper introduces a novel tree-based ensemble method for univariate and multivariate time series classification using shapelets, called the generalized random shapelet forest algorithm. The algorithm generates a set of shapelet-based decision trees, where both the choice of instances used for building a tree and the choice of shapelets are randomized. For univariate time series, it is demonstrated through an extensive empirical investigation that the proposed algorithm yields predictive performance comparable to the current state-of-the-art and significantly outperforms several alternative algorithms, while being at least an order of magnitude faster. Similarly for multivariate time series, it is shown that the algorithm is significantly less computationally costly and more accurate than the current state-of-the-art.  相似文献   

16.
张伟  王志海  原继东  郝石磊 《软件学报》2020,31(10):3216-3237
时间序列数据广泛产生于科技和经济的多个领域.基于符号傅里叶近似(symbolic Fourier approximation)和滑动窗口的定长单词抽取算法是目前时间序列特征字典构建过程中最有效的特征生成算法之一,但是该算法在特征生成过程中不能根据不同滑动窗口长度动态地选择保留的最优傅里叶值的个数,而且特征字典构建过程中缺少从生成的海量特征中对鉴别性特征进行有效选择的算法.为此,提出一种鉴别性特征字典构建算法.首先,提出一种针对不同长度滑动窗口学习最优单词长度的基于Fourier近似的可变长度单词抽取方法;其次,构建了一种新的特征鉴别性评价指标,并依据其动态阈值对生成的特征进行选择.实验结果表明,基于构建的特征字典的逻辑回归模型不仅分类精度高,而且可以有效发现预测过程中的鉴别性特征.  相似文献   

17.
基于异常序列剔除的多变量时间序列结构化预测   总被引:1,自引:0,他引:1  
针对传统多变量时间序列预测方法未考虑变量间依赖关系从而影响预测效果的问题,提出了一种基于异常序列剔除的多变量时间序列预测算法.该算法旨在利用多维支持向量回归机(Multi-dimensional support vector regression,M-SVR)内在的结构化输出特性,对选取到具有相似性的多个变量序列进行联合预测.首先,对已知序列进行基于模糊熵的层次聚类,实现对相似序列的初步划分;其次,求出类中所有序列的主曲线,根据序列到主曲线的距离计算各个序列的异常因子,从而进一步剔除聚类结果中的异常序列;最后,将选取到的相似变量序列作为输入,利用M-SVR进行预测.通过理论分析,证明本文算法在理论上存在信息损失上界与可靠度下界,从而说明本文算法的合理性与可行性.采用混沌时间序列数据与多个实际数据集进行对比实验,结果表明,与现有多个代表性方法相比,本文算法可有效挖掘多变量时间序列的内在结构信息,预测精度更高,数值稳定性更好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号