首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 468 毫秒
1.
《微型机与应用》2015,(20):48-50
时间序列的维数比较大,直接对时间序列进行聚类性能不理想。如何提高时间序列的聚类性能,是主要研究点。首先使用邻域保持嵌入对时间序列样本维数约简,然后对维数约简后的数据进行聚类融合,最后将它的聚类性能与已有方法如主成分分析、分段聚合近似进行比较。实验表明,所提出的算法更能提高聚类性能。  相似文献   

2.
近年来,基于符号表示的时间序列分类方法受到广泛关注,大部分现有方法对原始数据进行符号表示时,没有使用类别的标签信息。提出基于线性判别分析(LDA)的时间序列符号表示方法,考虑最大化类间区分度,使用LDA对原始数据集进行维数约减。再利用信息增益寻找降维后数据的符号投影区间,采用多重系数分箱(MCB)技术将维数约简后数据表示成符号序列。该方法在20个时间序列数据集上的分类效果好于已有方法,有监督的符号表示方法能有效提高分类性能。  相似文献   

3.
基于回归系数的时间序列维约简与相似性查找   总被引:1,自引:0,他引:1  
在时间序列中进行相似性查找往往需要进行维约简.以往的维约简方法或者时间复杂度太大并且不直观(如DWT、DFT等),或者无法用于准确的相似性查找(如PAA方法).本文提出一种新的基于回归系数的时间序列维约简方法--逐段回归近似(PRA).该方法具有线性时间复杂度,并且对均值平稳的独立噪声干扰不敏感,同时证明了基于PRA方法的相似性查找满足下界定理,因而是实用有效的.对实际数据的实验结果验证了本文的结论.  相似文献   

4.
殷飞  焦李成 《计算机科学》2014,41(5):283-287
针对高维数据导致的维数灾难问题,提出了一种基于面向分类准则的维数约简方法。所提准则使每个训练样本在特征空间中与同类样本尽可能接近,而与异类样本尽可能疏远。首先对每个训练样本定义同类样本加权平均距离和异类样本加权平均距离。然后基于上述两个概念分别定义总体同类距离和总体异类距离。以最小化总体同类距离和最大化总体异类距离为目的提出了面向分类的准则(Classification Oriented Criterion,COC)。最后,基于面向分类的准则推导出了一种新的维数约简方法。在公共人脸数据库ORL和Yale上的实验表明所提方法性能优于有代表性的维数约简方法。  相似文献   

5.
由于时间序列数据具有高维性等特征,不易直接进行挖掘.在对时间序列数据进行挖掘之前通常先进行特征表示达到降维的目的,分段聚合近似表示(PAA)是特征表示方法中比较常用的一种,针对PAA算法对每一区间有平均对待的缺点,提出一种采用小波熵的时间序列分段聚合近似表示,将小波熵运用到PAA算法的改进中,把某一区间内的小波能量熵值作为判评区间复杂度的指标,按各区间内小波熵值的比重分配各区间内分段数,实现对复杂区间详细描述,对相对平稳区间粗略逼近,利用matlab平台仿真证明,上述方法在压缩比相同的情况下比PAA方法更好地拟合原始序列,不仅能对时间序列有效地降维,而且能使近似更加精确,进而实现时间序列数据挖掘效率的提高.  相似文献   

6.
黄鸿  唐玉枭  段宇乐 《自动化学报》2022,48(10):2496-2507
大量维数约简(Dimensionality reducion, DR)方法表明保持数据间稀疏特性的同时,确保几何结构的保持能更有效提取出具有鉴别性的特征,为此本文提出一种联合局部几何近邻结构和局部稀疏流形的维数约简方法.该方法首先通过局部线性嵌入方法重构每个样本以保持数据的局部线性关系,同时计算样本邻域内的局部稀疏流形结构,在此基础上通过图嵌入框架保持数据的局部几何近邻结构和稀疏结构,最后在低维嵌入空间中使类内数据尽可能聚集,提取低维鉴别特征,从而提升地物分类性能.在Indian Pines和PaviaU高光谱数据集上的实验结果表明,本文方法相较于传统维数约简方法能明显提高地物的分类性能,总体分类可达到83.02%和91.20%,有利于实际应用.  相似文献   

7.
人脸识别一般都要先对人脸特征做维数约简,再做识别。有些传统的维数约简算法对训练样本的数量有一定的要求,比如对分类比较有效的LDA算法。而现实应用中,数据库往往只能为每个人脸对象提供数量非常有限的图片,甚至是单样本。提出一种基于均匀LBP(Local Binary Pattern)算子和稀疏编码的人脸识别方法,使用少量关键特征代替维数约简过程,解决训练样本稀少的问题。在Stirling人脸库上进行测试,获得较高的识别率和鲁棒性,证实了算法的有效性。  相似文献   

8.
提出一种基于边界鉴别分析的递归维数约简算法.该算法把已求取边界鉴别向量正交于待求超平面法向量作为支持向量机(SVM)优化问题新的约束条件;然后对改进SVM进行递归求解,得到正交边界鉴别向量基;最后将数据样本在正交边界鉴别向量上投影实现维数约简.该算法不仅克服了现有维数约简算法难以支持小样本数据集、受数据样本分布影响等问题,而且抽取的特征向量具有更优的分类性能.仿真实验说明了算法的有效性.  相似文献   

9.
针对现有多变量时间序列分类算法存在的要求序列等长和忽视类别信息两个不足,提出基于奇异值分解(SVD)和判别局部保持投影的分类算法。该算法基于降维思想,先通过SVD将样本的第一右奇异向量作为特征向量,以此将不等长序列转化为规模大小相同的序列;接着采用基于最大间距准则的判别局部保持投影对特征向量投影,充分利用类别信息以确保投影后同类样本尽量接近,异类样本尽量分散;最后在低维子空间采用1最近邻(1NN)、Parzen窗、支持向量机(SVM)和朴素Bayes分类器进行分类。在Australian Sign Language(ASL)、Japanese Vowels(JV)和Wafer三个公开的多变量时间序列数据集上进行的实验结果表明:在时间开销基本不变的前提下,所提方法取得了较低的分类错误率。  相似文献   

10.
针对现有多变量时间序列分类算法存在的要求序列等长和忽视类别信息两个不足,提出基于奇异值分解(SVD)和判别局部保持投影的分类算法。该算法基于降维思想,先通过SVD将样本的第一右奇异向量作为特征向量,以此将不等长序列转化为规模大小相同的序列;接着采用基于最大间距准则的判别局部保持投影对特征向量投影,充分利用类别信息以确保投影后同类样本尽量接近,异类样本尽量分散;最后在低维子空间采用1最近邻(1NN)、Parzen窗、支持向量机(SVM)和朴素Bayes分类器进行分类。在Australian Sign Language(ASL)、Japanese Vowels(JV)和Wafer三个公开的多变量时间序列数据集上进行的实验结果表明:在时间开销基本不变的前提下,所提方法取得了较低的分类错误率。  相似文献   

11.
赵慧赟  潘志松 《计算机科学》2018,45(5):180-184, 219
多元时间序列广泛存在于日常生活中的各个领域,多元时间序列分类是从时间序列数据中获取信息的基本方法。目前,时间序列分类研究面临着相似性度量方法特殊、原始数据维度高等问题,现有的多元时间序列分类方法的分类性能仍有待提高。文中提出一种基于shapelets学习的多元时间序列分类方法。首先,提出了新的正则化最小二乘损失学习框架下的shapelets学习方法,在此基础上采用基于shapelets的一元时间序列分类方法对多元时间序列的每维一元数据进行分类,随后由各维上的分类结果投票决定多元时间序列的最终分类结果。实验证明,所提方法在多元时间序列分类问题中能够取得较高的分类精度。  相似文献   

12.
基于符号表示的时间序列分类方法是时间序列数据挖掘的关键技术.大部分现有方法主要针对单个时间序列样本进行符号表示,没有考虑样本间的近邻关系对符号化分类的影响.对此提出一种基于正交局部保持映射(Orthogonal Locality Preserving Projection,OLPP)的时间序列符号表示方法.使用OLPP...  相似文献   

13.
时间序列数据广泛存在于我们的生活中,吸引了越来越多的学者对其进行深入的研究.时间序列分类是时间序列的一个重要研究领域,目前已有上百种分类算法被提出.这些方法大致分为基于距离的方法、基于特征的方法以及基于深度学习的方法.前两类方法需要手动处理特征和人为选择分类器,而大多数的深度学习方法属于端到端的方法,并且在时间序列分类...  相似文献   

14.
Early classification on time series   总被引:1,自引:1,他引:0  
In this paper, we formulate the problem of early classification of time series data, which is important in some time-sensitive applications such as health informatics. We introduce a novel concept of MPL (minimum prediction length) and develop ECTS (early classification on time series), an effective 1-nearest neighbor classification method. ECTS makes early predictions and at the same time retains the accuracy comparable with that of a 1NN classifier using the full-length time series. Our empirical study using benchmark time series data sets shows that ECTS works well on the real data sets where 1NN classification is effective.  相似文献   

15.
刘颖  李旭  吕政  赵珺  王伟 《控制与决策》2024,39(7):2315-2324
时间序列数据广泛存在于工业、医疗等应用领域,由于其时序相关性强、特征空间维度大,使得传统的时间序列分类方法普遍存在精度不足和需要复杂特征工程等问题.充分考虑深度神经网络在处理复杂时序数据上的优越性以及决策树方法拟合数据能力强的优势,提出一种基于残差网络和概率决策树的端到端统一深度学习模型.该模型利用残差网络从原始时间序列中提取高级特征,为了更好地建立时序数据特征与类别标签间的映射关系,将概率决策树融入至残差网络的分类层.同时,设计随机子空间的集成策略,缓解由于残差网络的深层结构产生的过度拟合现象,并给出联合优化模型分裂参数和预测参数的迭代优化方案.在大量的基准数据集和工业案例上进行实验和分析,实验结果表明,所提出模型的分类性能优于传统方法与其他深度学习方法,且可有效提高残差网络的泛化能力.  相似文献   

16.
Shapelet序列分析为时间序列分类提供了一种快速分类的方法,但Shapelet序列抽取速度很慢,限制了它的应用范围。为了加快 Shapelet 序列的提取,提出了一种基于主成分分析的改进方法。首先运用主成分分析法(PCA)对时间序列数据集进行降维,采用降维后的数据表示原数据,然后对降维后的数据提取出最能代表类特征的Shapelet序列。实验结果表明:本方法在保证分类准确率的前提下,提高了运算速度。  相似文献   

17.
分形维数在一维时间序列的分形特性分析中应用非常广泛,其计算方法多种多样,但是相关计算方法的全面对比鲜见文献报道。针对常用的八种一维时间序列分形维数计算方法,以WCF合成时间序列为研究对象,分别就算法的准确性和效率,对数据长度的依赖性进行分析对比。结果表明:准确性较好的三种算法是FA,DFA和Higuchi算法;而运算效率最高的是Sevcik,Katz和Castiglioni算法,但是它们的准确性偏低,而FA和Higuchi算法在计算时间上略微增加,但准确性比较高;在数据长度为4 096点时,各算法的计算值基本稳定,尤其是FA、Higuchi和DFA算法,在数据长度为4 096点时,计算值与理论值比较吻合。由此可以得出结论,Higuchi和DFA算法在计算一维时间序列的分形维数时性能优越,在相关的计算中优先选择。  相似文献   

18.
李海林  梁叶 《控制与决策》2020,35(3):629-636
针对传统主成分分析及相关方法对多元时间序列特征表示的局限性,以及降维效果对数据相似性度量质量的影响,从数据形态特征的角度出发,提出一种关键形态特征的多元时间序列降维方法.利用动态时间弯曲方法找出训练集每个类别的中心多元时间序列,根据形态特征找出每个中心多元时间序列的关键特征变量分量的重要度,使用重要度提取若干个关键特征变量分量,达到数据降维的目的.实验结果表明,与传统方法相比,所提方法能够有效地根据形态特征对多元时间序列进行降维,并且能够取得更好的分类效果.  相似文献   

19.
运动想象脑电是一种多通道高维信号,特征选择可以降低特征维数,选择更具判别性的特征,从而有效提高脑电解码的性能。现有的特征选择方法主要包括过滤式、包裹式和嵌入式方法,这3类方法各有优缺点。为了综合利用各类方法的优势,提出2种混合特征选择方法。第1种方法,使用最小绝对值收缩和选择算子(LASSO)进行特征选择,得到LASSO模型的权重之后,再设定一系列权重阈值进行二次特征筛选。第2种方法,使用Fisher分数对特征进行评分,然后设定一系列权重阈值进行二次特征筛选。使用Fisher线性判别分析(FLDA)对2种方法选择的特征子集进行分类。在2组脑机接口(BCI)竞赛数据集和1组实验室自采集数据集上进行实验,最高平均分类准确率分别为77.47%、76.11%、71.30%。实验结果表明,所提出的方法其分类性能优于现有的特征选择方法,而且特征选择时间也具有较大优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号