首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 370 毫秒
1.
李海林  梁叶 《控制与决策》2020,35(3):629-636
针对传统主成分分析及相关方法对多元时间序列特征表示的局限性,以及降维效果对数据相似性度量质量的影响,从数据形态特征的角度出发,提出一种关键形态特征的多元时间序列降维方法.利用动态时间弯曲方法找出训练集每个类别的中心多元时间序列,根据形态特征找出每个中心多元时间序列的关键特征变量分量的重要度,使用重要度提取若干个关键特征变量分量,达到数据降维的目的.实验结果表明,与传统方法相比,所提方法能够有效地根据形态特征对多元时间序列进行降维,并且能够取得更好的分类效果.  相似文献   

2.
多元时间序列特征降维方法研究   总被引:2,自引:0,他引:2  
针对常见的降维方法难以有效地保留多元时间序列主要特征的问题,分析了传统PCA方法在多元时间序列降维中的局限性;提出一种基于共同主成分分析的线性降维方法;把共同主成分与核技巧相结合,通过数学推导,将其拓展为基于共同核主成分分析的非线性降维方法;最后分析两种方法的降维有效性.与传统PCA方法相比,基于共同核主成分分析的降维方法可以表达变量间的非线性关系、能够选取合适的核函数和形状参数,因此降维手段更为灵活、对数据的适应性更强.实验结果表明,本文提出的降维方法能够更有效地对多元时间序列进行降维.  相似文献   

3.
赵超  王腾江  刘士军  潘丽  嵇存 《软件学报》2020,31(3):763-777
基于Shapelet的时间序列分类算法具有可解释性,且分类准确率高、分类速度快.在这些算法中,Shapelet学习算法不依赖于单一分类器,能够学习出不在原始时间序列中的Shapelet,可以取得较高的分类准确率,同时还可以保证Shapelet发现和分类器构建同时完成;但如果产生的Shapelet过多,会增加依赖参数,导致训练时间太长,分类速度低,动态更新困难,且相似重复的Shapelet会降低分类的可解释性.提出一种选择性提取方法,用于更精准地选择Shapelet候选集,并改变学习方法以加速Shapelet学习过程;方法中提出了两个优化策略,通过对原始训练集采用时间序列聚类,可以得到原始时间序列中没有的Shapelet,同时在选择性提取算法中加入投票机制,以解决产生Shapelet过多的问题.实验表明,该算法在保持较高准确率的同时,可以显著地提高训练速度.  相似文献   

4.
针对常见的降维方法难以有效保留多元时间序列主要特征的问题,分析了传统主成分分析(PCA)方法在多元时间序列降维中的局限性,提出一种基于共同主成分分析的多元时间序列降维方法,并通过仿真实验比较了两种方法的降维有效性和计算复杂度.实验结果表明,所提出的降维方法能够以相对较小的计算代价,更有效地对多元时间序列进行降维.  相似文献   

5.
近年来,时间序列分类问题的研究受到了广泛关注。先进的时间序列分类方法通常建立在良好的特征表示的基础之上。Shapelet是时间序列中具备鉴别性的子序列,可有效表达时间序列的局部形状特征。然而,高昂的计算成本大大限制了基于Shapelet的时间序列分类方法的实用性。除此之外,传统的Shapelet仅能描述欧氏距离度量下子序列的形状特征,因此极易受到噪声干扰并难以挖掘子序列中蕴含的其他类型的鉴别性信息。为应对上述问题,提出了一种新的时间序列分类算法——嵌入典型时间序列特征的随机Shapelet森林。该算法基于以下3个关键策略:1)随机选取Shapelet并限制Shapelet的作用范围以提高效率;2)在Shapelet中嵌入多个典型时间序列特征以提高算法对不同分类问题的适应性,并弥补随机选取Shapelet带来的精度损失;3)在新的特征表示的基础上构建随机森林分类器以确保算法的泛化能力。112个UCR时间序列数据集上的实验结果表明,本文算法的准确性超越了基于Shapelet精确搜索和Shapelet转换技术的STC算法,以及多个其他类型的先进时间序列分类算法。此外,广泛的实验对比验证了本文...  相似文献   

6.
数据降维是提高入侵检测分类器的学习效率和检测速度的重要手段。针对目前入侵检测数据特征降维力度不够,提出了一种基于主成分分析的分类特征降维方法。该方法把样本集按数据类型分割成多个子集,分别对每个子集进行主成分分析来消除各子集间在降维时的相互影响,使得每个子集的降维达到最佳。实验结果表明采用分类主成分分析方法能够更有效地降低数据维数,提高了入侵检测分类器的学习速度和检测速度。  相似文献   

7.
一个高效的多变量时间序列聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
时间序列聚类分析是数据挖掘研究的一个重要内容。已有的聚类算法大多采用k均值对低维数据进行聚类,不能对高维多变量时间序列(MTS)数据进行有效聚类。提出一种高效的多变量时间序列聚类算法PCA-CLUSTER,首先利用主成分分析对MTS数据降维;选取MTS数据的主成分序列进行K近邻聚类分析。理论分析和实验结果表明算法可以有效解决MTS数据聚类问题。  相似文献   

8.
基于分段行列2D-PCA的高光谱图像数据降维方法   总被引:1,自引:0,他引:1  
《计算机工程》2017,(9):256-262
针对传统二维主成分分析(2D-PCA)方法不能直接应用于高光谱图像数据降维的不足,提出一种基于分段行列2D-PCA的降维方法。利用高光谱图像波段间的相关系数进行波段子空间划分,在各子空间内通过旋转构建新的数据模型,以2D-PCA方法提取其行、列主成分信息,经过图像重建得到行、列主成分图像,对各波段子空间的行、列主成分图像进行小波分解,按照不同规则融合低频、高频系数,再通过小波逆变换得到降维后的图像。实验结果表明,与PCA和分段PCA方法相比,该方法在保证降维图像质量的前提下可缩短运算时间,提高高光谱图像的降维效率。  相似文献   

9.
为了克服主成分分析(PCA)对共空间模式(CSP)提取脑电信号特征进行降维时,仅考虑主成分对输入变量的表征能力,而忽略了对输出变量进行解释的这一个缺点,提出偏最小二乘回归(PLS)进行降维,通过CSP对数据增强后的信号进行特征提取,采用PLS进行降维,将提取的主成分信息包含对因变量解释程度高的特征作为特征向量,使用PSO-SVM进行分类,用2005 BCI竞赛的数据集IIIa进行分类测试,结果得到3位被试的想象运动平均分类正确率91.71%,通过与CSP-LDS、WL-CSP和CSP等算法的比较,3位被试的平均分类正确率最高,验证了该算法的有效性。  相似文献   

10.
为确保高维数据的神经网络分类精度,提出了先降维后分类的方法。采用主成分分析(PCA)法实现高维数据的降维。通过分析传统BP算法,提出分两步来更新网络权值的扰动BP学习方法。采用MATLAB对降维分类算法的分类精度和误差收敛速度进行分析。仿真结果显示:先降维再采用扰动BP网络进行高维数据分类可大大提高数据的分类精度和训练速度。  相似文献   

11.
曹阳  闫秋艳  吴鑫 《计算机应用》2021,41(3):651-656
针对现有集成分类方法对不平衡时间序列数据学习能力欠佳的问题,采用优化组件算法性能和集成策略的思路,以异构集成方法即基于变换的集合的层次投票集合(HIVE-COTE)为基础,提出一种不平衡时间序列集成分类算法IMHIVE-COTE。该算法主要包含两个改进内容:首先,增加了一个新的不平衡分类组件SBST-HESCA,引入Boosting结合重采样的思路,并通过交叉验证预测结果来更新样本权重,从而使数据集的重采样过程更有利于提升少数类样本的分类质量;其次,结合SBST-HESCA组件对HIVE-COTE计算框架进行改进,通过优化组件算法的权重使不平衡时间序列分类算法对分类结果拥有更高的投票比重,从而再次提升集成算法整体的分类质量。实验部分对IMHIVE-COTE的性能进行了验证和分析:和对比方法相比,IMHIVE-COTE有最高的整体分类评价,并且在三个不平衡分类指标值上分别得到了最优、最优、第三优的整体分类评价,可以证明IMHIVE-COTE解决不平衡时间序列分类问题的能力明显较高。  相似文献   

12.
基于自动子空间划分的高光谱数据特征提取   总被引:7,自引:0,他引:7  
针对遥感高光谱图像数据量大、维数高的特点,提出了一种自动子空间划分方法用于高光谱图像数据量减小处理。该方法主要包括3个处理步骤:数据空间划分,子空间主成分分析和基于类别可分性准则的特征选择。该方法充分利用了高光谱图像各波段数据之间的局部相关性,将整个数据划分为若干个具有较强相关性的独立子空间,然后在子空间内利用主成分分析进行特征提取,根据各类地物间的类别可分性选择有效特征,最后利用地物分类来验证该方法的有效性。实验结果表明,该方法能够有效地实现高光谱图像数据维数减小和特征提取,同现有的自适应子空间分解方法和分段主成分变换方法相比,该方法所提取的特征用于分类时能获得较好的分类精度。利用该方法进行处理,当高光谱数据维数降低了90%时,9类地物分类实验的总体分类精度可以达到80.2%。  相似文献   

13.
针对基于shapelets转换的时间序列分类算法因shapelets候选集中存在大量相似序列而造成耗时过长的问题,提出了一种基于LSH的shapelets转换方法(Locality Sensitive Hashing Shapelets Transform,LSHST),提出一种局部敏感哈希函数(LSH)的改进算法,对原始子序列候选集进行逐级过滤筛选,快速挑选出形态上具有代表性的shapelets集合,计算集合中shapelets的质量,采用覆盖的方法确定将要进行转换的shapelets,进一步减小shapelets的数量,进行shapelets转换。实验表明,与Shapelet Transform(ST)、ClusterShapelets(CST)和Fast Shapelet Selection(FSS)算法相比,LSHST在分类精度上最高提升了20.05、19.9和16.52个百分点,在时间节省程度上最高达8 000倍、16 000倍和8.5倍。  相似文献   

14.
Shapelet是一种具有辨识性的时间序列子序列,通过识别局部特征达到对时间序列准确分类的目的。原始shapelet发现算法效率较低,大量工作关注于提高shapelet发现的效率。然而,对于带有趋势变化的时间序列,采用典型的时间序列表示方法进行shapelet发现,容易造成序列中趋势信息的丢失。为了解决时间序列趋势信息丢失的问题,提出一种基于趋势特征的多样化top-k shapelet分类方法:首先采用趋势特征符号化方法对时间序列的趋势信息进行表示;然后针对序列的趋势特征符号获取shapelet候选集合;最后通过引入多样化top-k查询算法从候选集中选取k个最具代表性的shapelets。在时间序列的分类实验中,与传统分类算法相比,所提方法在11个数据集上的分类准确率均有提升;与FastShapelet算法相比,提升了运行效率,缩短了算法的运行时间,并在趋势信息明显的数据上效果显著。结果表明,所提方法能有效提高时间序列的分类准确率,提升算法运行效率。  相似文献   

15.
基于KPCA的决策树方法及其应用   总被引:2,自引:0,他引:2  
主成分分析(PCA)作为一种数据减少技术常用于构造决策树,有利于降低树的复杂度和提高分类精度,但在处理非线性问题时往往不能取得好的效果.针对上述情况,提出了一种基于核主成分分析(KPCA)的决策树方法.实验结果表明,该方法是可行的和有效的,且在分类精度、方差贡献率等方面优于基于PCA的决策树.  相似文献   

16.
李霞 《计算机仿真》2021,38(1):291-294
针对数据挖掘过程中对异常数据检测的准确率较低、分类速度较慢,导致数据分类准确率较低、效率较差的问题,提出基于连续密度隐马尔可夫的时间序列分类算法.构建时间序列变化趋势分割点目标函数,利用贪婪搜索法求解时间序列分段值,提取序列变化趋势特征得到数据主要信息,提升数据分类的准确性;改进帧内特征表达准确性,使用因子分析矩阵高斯...  相似文献   

17.
shapelets是描述时间序列局部特征的子序列,它能最大程度对不同类别进行区分。从它的发明至今一直吸引着研究者的关注,但是由于过高的时间复杂度阻碍了它被广泛应用。一种快速查找多个shapelets的方法(Non-Similar Discover of Shapelet,NSDS)被提出:基于shapelets非相似的特性,根据子序列间距离分布设置一个距离阈值,以此过滤掉候选集中的相似子序列。再使用类可分离性作为过滤后的候选子序列的评价标准,最终选择出性能最好的多个shapelets。通过在单变量时间序列数据集上的实验表明了该方法可以极大缩短查找shapelets时间,而且能保持较高的分类准确性。将该方法扩展到多变量时间序列,对多个变量采用组合分类器的方法来提高整体分类的准确率。  相似文献   

18.
李海林 《控制与决策》2015,30(3):441-447
针对高维特性对多元时间序列数据挖掘过程和结果的影响,以及传统主成分分析方法在多元时间序列数据特征表示上的局限性,提出一种基于变量相关性的多元时间序列数据特征表示方法。通过协方差矩阵描述每个多元时间序列的分布特征和变量相关关系,利用主成分分析方法对综合协方差矩阵进行主元分析,进而实现多元时间序列的数据降维和特征表示。实验结果表明,所提出的方法不仅能提高多元时间序列数据挖掘的质量,还可以对不等长多元时间序列进行快速有效的挖掘。  相似文献   

19.
Wan  Xiaoji  Li  Hailin  Zhang  Liping  Wu  Yenchun Jim 《The Journal of supercomputing》2022,78(7):9862-9878

A multivariate time series is one of the most important objects of research in data mining. Time and variables are two of its distinctive characteristics that add the complication of the algorithms applied to data mining. Reduction in the dimensionality is often regarded as an effective way to address these issues. In this paper, we propose a method based on principal component analysis (PCA) to effectively reduce the dimensionality. We call it “piecewise representation based on PCA” (PPCA), which segments multivariate time series into several sequences, calculates the covariance matrix for each of them in terms of the variables, and employs PCA to obtain the principal components in an average covariance matrix. The results of the experiments, including retained information analysis, classification, and a comparison of the central processing unit time consumption, demonstrate that the PPCA method used to reduce the dimensionality in multivariate time series is superior to the prior methods.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号