首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
在时间序列挖掘工作中,比如聚类和分类,需要计算距离来衡量时间序列样本之间的相似性,有许多研究都致力于时间序列相似性度量的研究.充分利用非线性趋势特征来进行时间序列挖掘.首先计算时间序列的ACF,进而构造ACF的非线性趋势特征,利用该特征作为时间序列相似性度量来进行聚类,它给时间序列平稳性的判定提供了一种新的途径.列举了一个模拟数据和一个实际数据来进行实例验证,实验结果表明,ACF非线性趋势特征作为一种新的相似性度量,相对已有的一些相似性度量而言,ACF非线性趋势特征通常只需计算少量的若干特征值就能更合理地刻画时间序列的平稳性特征.借助K-means进行聚类实验.  相似文献   

2.
李海林  杨丽彬 《控制与决策》2013,28(11):1718-1722

数据降维和特征表示是解决时间序列维灾问题的关键技术和重要方法, 它们在时间序列数据挖掘中起基础性作用. 鉴于此, 提出一种新的时间序列数据降维和特征表示方法, 利用正交多项式回归模型对时间序列实现特征提取, 结合特征序列长度对时间序列的拟合分析结果, 运用奇异值分解方法对特征序列进一步降维处理, 进而得到保存大部分信息且维数更低的特征序列. 数值实验结果表明, 新方法可以在维度较低的特征空间下取得较好的数据挖掘聚类和分类效果.

  相似文献   

3.
时间序列是将同一指标的数值按照时间的先后顺序排列组成的一组随机数列.随着科学技术的蓬勃发展,时间序列在数据挖掘领域中的应用变得越来越广泛.综合分析了近年来时间序列在数据挖掘领域的文献成果,对时间序列特征表示和相似性度量方法进行了阐述.针对时间序列特征表示方法,从非数据适应性方法、数据自适应性方法、基于模型的方法三方面进...  相似文献   

4.
《微型机与应用》2015,(12):7-10
时间序列数据可视化综合了时间序列数据挖掘、数据可视化、计算机图形学、计算机交互技术等学科的理论和方法。从时间和数据两个角度分析了时间序列数据的特征;从用户的角度探讨了时间序列数据可视化的主要任务;综述了时间序列数据可视化从以人为中心到以计算机为中心,再到人机交互方式的发展历程;详细介绍了时间序列数据可视化的5类图表和5类表达方式。最后,对时间序列数据可视化研究进行总结和展望。  相似文献   

5.
时间序列数据广泛存在于我们的生活中,吸引了越来越多的学者对其进行深入的研究.时间序列分类是时间序列的一个重要研究领域,目前已有上百种分类算法被提出.这些方法大致分为基于距离的方法、基于特征的方法以及基于深度学习的方法.前两类方法需要手动处理特征和人为选择分类器,而大多数的深度学习方法属于端到端的方法,并且在时间序列分类...  相似文献   

6.
基于波动特征的时间序列数据挖掘   总被引:2,自引:0,他引:2  
针对相似度搜索是时间序列数据挖掘的基础,构造鲁棒的动态时间弯曲距离是相似性研究的关键,考虑时间序列特征点的重要意义,引入一种时间序列波动点的抽取方法,采用二叉特征树结构对原序列进行再表达.该方法既提取了序列整体趋势信息,又有效约减了数据维数.对多个数据集的层次聚类实验表明,在保证较高准确率情况下,该方法显著提高了DTW的计算效率.  相似文献   

7.
研究了应用数据挖掘技术预测时间序列数据中事件的方法。针对时间序列数据提出了显著特征提取算法,给出了特征间的相似度量标准,并应用特征聚类算法,将时间序列数据转换成相应的特征序列表示。应用频繁模式发现算法和预测模式生成算法在预测时段内发现与目标事件相关的时序特征模式,预测事件的发生。实验结果表明,该文所提出的方法能够有效地预测时间序列数据中的事件。  相似文献   

8.
李海林  梁叶 《控制与决策》2020,35(3):629-636
针对传统主成分分析及相关方法对多元时间序列特征表示的局限性,以及降维效果对数据相似性度量质量的影响,从数据形态特征的角度出发,提出一种关键形态特征的多元时间序列降维方法.利用动态时间弯曲方法找出训练集每个类别的中心多元时间序列,根据形态特征找出每个中心多元时间序列的关键特征变量分量的重要度,使用重要度提取若干个关键特征变量分量,达到数据降维的目的.实验结果表明,与传统方法相比,所提方法能够有效地根据形态特征对多元时间序列进行降维,并且能够取得更好的分类效果.  相似文献   

9.
李海林  梁叶 《控制与决策》2017,32(3):451-458
针对传统符号聚合近似方法在特征表示时容易忽略时间序列局部形态特征的局限性,以及动态时间弯曲在度量上的优势,提出一种基于数值符号和形态特征的时间序列相似性度量方法.将时间序列进行符号和形态的特征表示后,提出动态时间弯曲与符号距离结合的时间序列距离度量方法,使所提方法能够较好地反映时间序列数据数值分布和形态特征.实验结果表明,所提出的方法在时间序列数据挖掘中能够得到较好的分类效果,具有一定的优越性.  相似文献   

10.
李霞 《计算机仿真》2021,38(1):291-294
针对数据挖掘过程中对异常数据检测的准确率较低、分类速度较慢,导致数据分类准确率较低、效率较差的问题,提出基于连续密度隐马尔可夫的时间序列分类算法.构建时间序列变化趋势分割点目标函数,利用贪婪搜索法求解时间序列分段值,提取序列变化趋势特征得到数据主要信息,提升数据分类的准确性;改进帧内特征表达准确性,使用因子分析矩阵高斯...  相似文献   

11.
大数据背景下,机器学习和数据分析是利用大数据为人类服务的重要手段。本文阐述了机器学习算法的使用 步骤、特征维度的提取方法、特征模型建立的理论支撑,以及模型融合所占的权重。针对当前大数据下机器学习算法的关键技 术,对其发展前景进行了展望。  相似文献   

12.
高维流式大数据的产生与发展对传统机器学习和数据挖掘算法提出了诸多挑战。本文结合流式大数据流式到达的特性,首先建立自适应增量特征提取算法模型。然后,针对噪声环境,建立基于特征空间校准的增量流形学习算法模型,解决小样本问题。最后,构造流形学习的正则化优化框架,解决高维数据流特征提取过程中产生的降维误差问题,并得到最终的最优解。实验结果表明本文提出的算法框架符合流形学习算法的3个 评价指标:稳定性、提高性以及学习曲线能迅速增加到一个相对稳定的水平;从而实现了高维数据流的高效学习。  相似文献   

13.
针对模拟电路故障诊断中特征提取以及模型训练时间较长的难题,采用了一种基于深度极限学习机的模拟电路故障诊断算法。该算法将深度学习中自编码器的思想引入到极限学习机中,构建深度网络,将底层的故障特征转换更加抽象的高级特征,能自主地学习数据特征,避免了繁琐的特征提取和选择。最终通过Sallen-Key和四运放双二次高通滤波2个模拟电路进行仿真研究,实验结果验证了算法在模拟电路故障诊断上的可行性,也表明模型学习速度快、泛化能力好,具有较强的诊断能力,故障诊断分类准确率可以达到100%,诊断时间在0.3 s左右。  相似文献   

14.
苏本跃  倪钰  盛敏  赵丽丽 《控制与决策》2021,36(12):3031-3038
传统动力下肢假肢运动意图识别算法常使用机器学习算法分类器,在特征选择方面则需要手工提取.针对该问题将深度学习算法应用于运动意图识别研究中,通过在传统的卷积神经网络的基础上进行改进,使算法更适应于基于短时行为样本数据的运动意图识别,同时抑制深度学习算法应用于运动意图识别中的过拟合.在意图识别数据集中进行滑动窗口预处理,目的是对时间序列样本做数据增广,扩增目标数据集能够使训练集更加丰富全面,提高识别的精度,运用改进后的卷积神经网络对增广后的数据集进行特征学习与分类.实验结果表明,该方法在13类运动模式下的识别率达到93%.  相似文献   

15.
由于时间效率的约束,多元时间序列预测算法往往存在预测准确率不足的问题。对此,提出基于图拉普拉斯变换和极限学习机的时间序列预测算法。基于图拉普拉斯变换对时间序列进行半监督的特征提取,通过散布矩阵将监督特征和无监督特征进行融合。设计在线的极限学习机学习算法,仅需要在线更新网络的输出权重矩阵即可完成神经网络的学习。利用提取的特征在线训练极限学习机,实现对多元时间序列的实时预测。基于多个数据集进行仿真实验,结果表明该算法有效地提高了预测准确率。  相似文献   

16.
基于自编码算法的深度学习综述   总被引:2,自引:0,他引:2  
深度学习是机器学习的一个分支,开创了神经网络发展的新纪元.自编码算法作为深度学习结构的重要组成部分,在无监督学习及非线性特征提取过程中起到了至关重要的作用.首先介绍自编码算法的基本概念及原理,然后介绍基于自编码算法的改进算法,最后列举了自编码算法在若干领域应用的知名案例和发展趋势.  相似文献   

17.
揭示股票市场运行规律一直是研究的热点,近些年机器学习方法在股票预测方面取得了不错的进展,相较于传统的基本面分析、技术分析等方法,显示了独特的优势。从股票预测研究的主要问题、特征工程和机器学习算法应用等三个方面,对近年来该领域的主要文献进行总结,并针对每种算法在应用中的特点与不足进行评述。围绕目前机器学习在股票预测上遇到的主要问题,从迁移学习、特征工程、深度学习模型融合等方面进行了深入的分析与展望。  相似文献   

18.
针对传统反向传播(BP)神经网络和支持向量机(SVM)存在的过拟合、维数灾难、参数选择困难等问题,提出了一种基于深度学习算法的航空发动机传感器故障检测方法.对发动机参数记录仪采集的多维数据进行预处理,建立基于深度置信网络(DBN)的故障检测模型,利用预处理后的数据对检测模型进行训练,经过DBN故障检测模型逐层特征学习实现了传感器故障检测.仿真结果表明:在无人工特征提取和人工特征提取的情况下,基于DBN故障检测的准确率均高于BP神经网络和SVM模型.  相似文献   

19.
在多标记学习中,如何处理高维特征一直是研究难点之一,而特征提取算法可以有效解决数据特征高维性导致的分类性能降低问题。但目前已有的多标记特征提取算法很少充分利用特征信息并充分提取"特征-标记"独立信息及融合信息。基于此,提出一种基于特征标记依赖自编码器的多标记特征提取方法。使用核极限学习机自编码器将原标记空间与原特征空间融合并产生重构后的新特征空间。一方面最大化希尔伯特-施密特范数以充分利用标记信息;另一方面通过主成分分析来降低特征提取过程中的信息损失,结合二者并分别提取"特征-特征"和"特征-标记"信息。通过在Yahoo多组高维多标记数据集上的对比实验表明,该算法的性能优于当前五种主要的多标记特征提取方法,验证了所提算法的有效性。  相似文献   

20.
文章首先对基于机器学习算法的流特征分类方法研究现状进行了总结,对相关背景知识做了介绍。在特征集选择方面,依据选取的基础特征集所表达特点的不同采用独立的归一化度量准则。在聚类算法方面,根据DBSCAN和BIRCH算法的特性,提出了一种结合DBSCAN和BIRCH算法的改进算法;实验结果表明,与使用原始特征集分类相比,基于归一化特征集的分类处理时间缩短、全局准确率提高,而且改进的算法比传统BIRCH算法的精确率和召回率都明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号