ARIMA和LSTM方法长时间温度观测数据缺失值插补的比较 |
| |
引用本文: | 郑欣彤,边婷婷,张德强,贺伟.ARIMA和LSTM方法长时间温度观测数据缺失值插补的比较[J].计算机应用,2022(S1):130-135. |
| |
作者姓名: | 郑欣彤 边婷婷 张德强 贺伟 |
| |
作者单位: | 1. 资源与环境信息系统国家重点实验室(中国科学院地理科学与资源研究所);2. 中国科学院大学资源与环境学院;3. 北京联合大学管理学院;4. 中国科学院华南植物园鼎湖山森林生态系统定位研究站 |
| |
基金项目: | 国家重点研发计划项目(2017YFD0300403); |
| |
摘 要: | 针对野外小气象观测站点半小时温度观测长时间数据缺失问题,结合较低频次的人工温度观测数据,采用时间序列分析和深度学习等方法,对缺失的半小时温度观测数据进行高精度插补。首先,选用深度学习数据插补中的序列-序列(Seq2Seq)方法,建立了适合高精度温度数据插补需求的编码-解码深度学习模型BiLSTM-I;然后,选用了传统的代表性方法,从时间序列回归分析——差分整合移动平均自回归模型(ARIMA)状态方程形式中,获取卡尔曼平滑状态估计方程的各项参数,由卡尔曼平滑估计实现对温度观测数据缺失值的插补。实验分析结果表明,所设计的BiLSTM-I深度学习气温插补方法要优于时间序列的双向递归插补方法(BRITS-I)。对缺失值时间窗口为30 d的测试集,测试结果中均方根误差(RMSE)为0.47℃,相较于BRITS-I得到的RMSE,精度提升了0.90;对缺失值时间窗口为60 d的测试集,RMSE为0.49℃,相较于BRITS-I得到的RMSE,精度提升了0.90;基于ARIMA状态模型的插补方法也有较高的精度,RMSE为0.75℃。最后,还分析了BiLSTM-I深度学习插补方法对不同温度缺失时间长度...
|
关 键 词: | 气象观测数据 数据缺失 深度学习 时间序列分析 高精度插补 |
|