首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
3.
《微型机与应用》2019,(11):47-53
随着大数据时代的来临,多变量时间序列的应用价值得到了越来越多的关注。然而,缺失数据的存在严重影响了对多变量时间序列的进一步开发利用。针对这个问题,提出了基于改进递归神经网络的多变量缺失数据填充算法,该算法通过衰减机制可以获得更多有用的隐藏信息,从而更好地完成对多变量缺失数据的填充。首先,对多变量数据进行预处理,得到网络的输入向量;其次,在长短时记忆(Long-Short-Term Memory,LSTM)单元的基础上引入衰减机制,提出了两种改进的缺失数据填充模型。改进后的模型能够更多更好地获取长时间间隔的隐藏信息,并对输入进行相应的衰减处理。为检验算法的性能,在上海空气质量数据集以及多传感器数据融合活动识别系统(Activity Recognition system based on Multisensor data fusion,ARe M)数据集上进行了仿真实验。结果表明,相比于其他算法,所提算法能够更好地实现多变量时间序列的缺失数据填充。  相似文献   

4.
基于逐步回归分析的基因表达缺失值估计   总被引:1,自引:0,他引:1  
在基因芯片实验中,数据缺失客观存在,并且在一定程度上会影响芯片数据后续分析结果的准确性。在不增加实验次数的情况下,缺失值估计是降低缺失数据对后续分析影响的有效方法。针对基因表达数据的特点,提出了基于逐步回归分析方法的基因表达缺失值估计算法。实验结果表明,新的估计算法具有较传统缺失值估计算法更好的稳定性和估计准确度。  相似文献   

5.
对于时间序列挖掘过程中的缺失值处理,目前有许多方法。在处理数据变量成一定的相关的数据集时,回归模型不失为较好的插补方法。利用均值插补、一元线性回归、多元线性回归、迭代回归方法对水文时间序列数据集的缺失数据进行处理,比较不同的皮氏相关系数下各方法的优劣及适用性。文中研究表明当数据集中存在与缺值变量相关度较大的变量时,一元线性回归的插补简单直观,且有较高的精度,结果接近真实;当数据集中不存在与缺值变量显著相关的自变量时,一元线性回归的结果变差,多元线性回归与多元迭代回归具有较好的结果,但多元迭代回归迭代次数难以确定,插补代价较大,多元线性回归为最佳选择;当缺值变量与其他自变量相关系数均较小时,回归插补的结果不理想,此时可考虑其他插补方法。  相似文献   

6.
基于Sas的时间序列缺失值处理方法比较   总被引:1,自引:0,他引:1  
对于时间序列挖掘过程中的缺失值处理,目前有许多方法.在处理数据变量成一定的相关的数据集时,回归模型不失为较好的插补方法.利用均值插补、一元线性回归、多元线性回归、迭代回归方法对水文时间序列数据集的缺失数据进行处理,比较不同的皮氏相关系数下各方法的优劣及适用性.文中研究表明当数据集中存在与缺值变量相关度较大的变量时,一元线性回归的插补简单直观,且有较高的精度,结果接近真实;当数据集中不存在与缺值变量显著相关的自变量时,一元线性回归的结果变差,多元线性回归与多元迭代回归具有较好的结果.但多元迭代回归迭代次数难以确定,插补代价较大.多元线性回归为最佳选择;当缺值变量与其他自变量相关系数均较小时,回归插补的结果不理想,此时可考虑其他插补方法.  相似文献   

7.
时间序列数据挖掘是数据挖掘领域的热点之一。相似性度量是时序挖掘领域的基础问题,直接决定了时序数据分类和聚类的效果。针对现有经典的时序数据相似性度量方法共同主成分分析(CPCA)和二维奇异值分解(2DSVD)中存在无法保存时序数据集合中蕴含的某些重要局部特征的问题,提出了基于数据分块方式的CPCA方法和2DSVD方法。该算法首先对原始多变量时间序列数据进行分块处理,然后对分块得到的子矩阵采用CPCA、2DSVD进行特征提取,从而得到代替原始模式的低维新模式,最后在低维空间中利用最小距离法构建分类器对多变量时间序列进行分类。EEG数据分类实验证明了所提方法的有效性。  相似文献   

8.
在航天器遥测数据预测领域,基于时间序列的预测方法有着广阔的应用前景;时间序列有一明显的特性就是记忆性,记忆性是指时间数列中的任一观测值的表现皆受到过去观测值影响;它的基本思想是根据观测数据的特点为数据建立尽可能合理的统计模型,利用模型的统计特性解释数据的统计规律,以期达到预报的目的;提出了采用模式识别和参数估计的方法,结合航天器遥测动态数据,建立关于航天器遥测数据的时序预测模型,对航天器遥测数据趋势进行检测和预报。  相似文献   

9.
基于KPCA的多变量时间序列数据异常检测方法研究   总被引:1,自引:0,他引:1  
介绍了一种采用的KPCA技术获取多变量时间序列数据高维特征空间的主成方向矢量,使用主成方向矢繁内积作为异常的度量,并采用vMF分布表征主成方向矢量分布来进行多变量时间序列数据异常检测的方法;检测过程中使用历史数据训练获取分布模型的参数估计,通过计算实际数据主成方向矢量在训练模型的概率来判断异常的发生;与传统的异常检测方法相比,该方法不依赖先验的专家知识,且能够通过训练学习自动调节模型参数,可用于不同系统的异常检测中;实验表明,该方法具有较高的有效性.  相似文献   

10.
传感器网络中一种基于多元回归模型的缺失值估计算法   总被引:1,自引:0,他引:1  
在无线传感器网络中,感知数据的缺失问题不可避免,并且给无线传感器网络的各种应用带来了巨大困难.解决该问题的最好办法是对缺失数据进行准确估计.提出了一种基于多元回归模型的缺失值估计算法.该算法首先依感知数据的时间相关性和空间相关性分别采用多元线性回归模型对缺失数据进行估计,然后根据回归模型的拟合优度对基于时间维和空间维求出的两个估计值分别赋予相应的权值系数,并将其加权平均值作为缺失数据的最后估计值.由于该算法在对缺失值进行估计时,同时考察多个邻居节点并联合地用其感知数据来共同估计缺失值,因此该算法具有可靠、稳定的估计性能.在两个真实的数据集合上对该算法进行了测试,实验结果表明提出的缺失值估计算法能够有效估计无线传感器网络中的缺失数据.  相似文献   

11.
基于时间序列模式表示的异常检测算法*   总被引:2,自引:0,他引:2  
提出了一种基于时间序列的模式表示提取时间序列异常值的异常检测算法(PREOV).时间序列的模式表示本身就具有压缩数据、保持时间序列基本形态的功能,并且具有一定的除噪能力.在时间序列模式表示的基础上提取异常值,可以大大提高算法的效率和准确性,达到事半功倍的效果.在本算法中,还使用了一定的剪枝策略,使得算法的时间复杂度进一步降低.该算法计算简单、实现方便、无须训练,可以支持时间序列的动态增长.  相似文献   

12.
基于马氏距离的缺失值填充算法   总被引:1,自引:0,他引:1  
杨涛  骆嘉伟  王艳  吴君浩 《计算机应用》2005,25(12):2868-2871
提出了一种基于马氏距离的填充算法来估计基因表达数据集中的缺失数据。该算法通过基因之间的马氏距离来选择最近邻居基因,并将已得到的估计值应用到后续的估计过程中,然后采用信息论中熵值的概念计算最近邻居的加权系数,得到缺失数据的填充值。实验结果证明了该算法具有有效性,其性能优于其他基于最近邻居法的缺失值处理算法。  相似文献   

13.
探讨了如何为CBR(基于范例的推理)增加对一种特殊的范例类型——时间序列数据的支持.分析了基于谱分析的时间序列相似度比较算法不适用于CBR检索的缺点,并在此基础上设计了一种综合性能很好的CBR检索算法.思路是把时间序列相似度比较转化成一个卷积问题,并用DFT来简化这个卷积的计算.通过对这种CBR检索算法进行了深入的理论分析和认真的实验,结果证明,提出的算法是一个高效的算法.在这个检索算法的基础上,CBR就能够席用到时序数据的分析推理中,具有广阔的应用前景.  相似文献   

14.
探讨了如何增强CBR对一种常见的时态信息,即时间序列数据的检索能力;分析了已有的基于傅里叶频谱分析的时间序列检索算法应用于CBR时遇到的问题,并根据时态CBR检索的需要,提出了一种新的基于循环卷积和傅里叶变换时间序列检索算法.理论分析和数值实验结果都证明,提出的算法在检索效率上有一定的优势.将采取这种检索方法的时态CBR应用于时间序列的预测问题中,取得了较好的预测效果且具有较高的预测效率.  相似文献   

15.
时间序列异常检测   总被引:3,自引:0,他引:3  
在k-近邻局部异常检测算法的基础上,结合时间序列的分割方法,提出了一种高效的时间序列异常检测算法。该算法首先把序列重要点作为数据的分割点,对时间序列数据进行高比例压缩;其次利用局部异常检测方法检测出时间序列中的异常模式。通过心电图(ECG)数据实验验证了算法的有效性和合理性。  相似文献   

16.
为提高时间序列相似匹配的精度和效率,提出一种基于小波包变换的时间序列相似匹配算法.首先利用小波包可对信号进行精细分析的特点,对时间序列进行维数约简,用变换后的低频系数和部分高频均值系数作为特征向量表示原始序列;然后用多维索引结构R树存储这些特征向量,将欧几里德距离作为相似尺度,在此基础上实现了范围查询和k近邻查询,对电力负荷时间序列数据的仿真实验结果表明了算法的有效性。  相似文献   

17.
李永立  吴冲  王崑声 《计算机工程与设计》2011,32(12):4190-4193,4201
为了解决大量文献对时间序列数据的建模、仿真及预测的研究存在不做模型选择,直接应用某种模型进行分析的局限,针对经常应用于时间序列分析的3种人工智能模型:隐马尔可夫模型、人工神经网络模型和自回归移动平均模型进行基于仿真比对方法的模型选择研究。简述3种模型的基本原理,对各类模型进行数值仿真,考察各类模型生成时间序列的特征,以该特征为依据,提出模型选择的理论与算法,应用本文的模型选择理论和算法,进行实证分析。实验结果表明,各类模型生成的时间序列数据有不同的数理特征,其提供了模型选择的依据,同时,该选择理论是实用的,应用该理论选择的模型有较好的拟合和预测效果,为时间序列类型的数据挖掘提供了依据。  相似文献   

18.
针对采样不规则轨迹的停留点检测准确性不高的问题,提出了一种基于时间序列聚类的停留点检测算法。首先基于数据场理论设计了一种综合考虑时空特性的混合特征密度测量方法,然后根据停留点中心密度比入口大的特性,采用过滤—精炼策略提取停留点。在过滤阶段,将时间连续且满足最小密度阈值的点作为候选停留点。在精炼阶段,通过最大阈值筛选出实际停留点。实验结果表明,该方法能够有效检测采样不规则轨迹中的停留点,相较于已有方法具有较高的准确性和较低的时间消耗。  相似文献   

19.
基于螺旋图的时间序列数据可视化   总被引:1,自引:0,他引:1  
阶段性时间序列数据是一种生活中常见数据形式,它描述一个包含多个状态转换的事件,每个状态都具有时间属性,且状态之间的转换存在多条路径。针对现有的可视化方法不能有效展示各个状态之间变化以及状态间路径的时间属性信息的问题,提出一个全新的基于螺旋图的可视化模型。该模型使用一个圆环表示一个状态,一个事件的多个状态采用一组同心圆表示,状态间可达路径采用螺旋线表示,螺旋线的起始位置由其起始时间与起始状态圆环决定,终止位置由其结束时间与结束状态圆环决定。针对路径过多导致路径覆盖较为严重的问题,该模型采用基于长尾函数的透明算法,根据一条路径与其他路径的交叉数,为每条路径分配透明度。该模型还提供了路径的筛选、高亮、查看详细信息、缩放等功能,实现了灵活的交互操作。通过对中国铁路列车站点数据进行实验,实验结果表明该模型能够在有限的空间中有效地展示站点间运行任意时长的列车,并且在列车较多的情况下降低了螺旋线交叉重叠带来的杂乱度,同时有效地保留了列车的运行信息,能够为用户路线的选择提供决策支持,说明了该模型对阶段性时间序列数据可视化的有效性。  相似文献   

20.
This article presents an improved method of fuzzy time series to forecast university enrollments. The historical enrollment data of the University of Alabama were first adopted by Song and Chissom (Song, Q. and Chissom, B. S. (1993). Forecasting enrollment with fuzzy time series-part I, Fuzzy Sets and Systems, 54, 1–9; Song, Q. and Chissom, B. S. (1994). Forecasting enrollment with fuzzy time series-part II, Fuzzy Sets and Systems, 54, 267–277) to illustrate the forecasting process of the fuzzy time series. Later, Chen proposed a simpler method. In this article, we show that our method is as simple as Chen's method but more accurate. In forecasting the enrollment of the University of Alabama, the root mean square percentage error (RMSPE) of our method is 3.1113% while the RMSPE of Chen's method is 4.0516%, which shows that our method is doing much better.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号