基于ERA5再分析数据的亚太地区气温短期预测研究报告

一、研究背景与动机

近年来，全球气候变暖趋势日益显著，极端气候事件频发，对生态环境和社会经济造成了巨大影响。亚太地区作为全球人口最密集、经济最活跃的区域之一，其气候变化状况不仅影响本区域，也具有全球性意义。因此，提升该地区气温变化趋势的预测精度，对制定科学合理的气候政策具有重要意义。

本研究聚焦于2015年至2024年间亚太地区的气温变化趋势，基于ERA5再分析数据，并结合大气CO₂浓度与ENSO（厄尔尼诺-南方涛动）指数，构建气温短期预测模型。

二、数据来源与处理

本研究使用的主要数据包括：

ERA5气温数据：来自欧洲中期天气预报中心（ECMWF），时空分辨率高，涵盖2015-2024年亚太区域。
CO₂浓度数据：来自NOAA，选取Mauna Loa站的全球代表性月度均值。
ONI（ENSO）指数：用于表征厄尔尼诺/拉尼娜事件的强度与状态。

数据预处理步骤包括：

清洗与异常值检测
标准化处理（Z-score）
时间对齐（特别是ONI跨年的季节码）

三、探索性分析与变量关联

使用可视化（箱线图、热力图、散点图）揭示温度、CO₂浓度、ENSO指数之间的关系；
相关性分析表明，在去除季节性因素后，CO₂浓度与温度异常呈中等正相关（r≈0.4），ENSO与温度异常相关性略低但仍显著；
时间序列分解表明，气温变化中**趋势成分占比约60%**，季节性成分约35%，残差成分约5%。

四、特征工程与建模输入

我们设计并筛选了14个输入特征，包括：

时间与周期特征：如 month_cos、season_sin
滞后特征：如 temperature_lag_1、temperature_lag_12
滚动统计特征：如 temperature_rolling_mean_3
交互特征：如 temperature_div_co2（单位CO₂浓度下温度），temperature_mul_co2 等

最终特征在控制冗余与共线性后，保留了对预测贡献最大的特征集。

五、模型选择与训练方法

我们选用 LightGBM 作为主模型，理由包括：

强大的非线性建模能力；
高效处理高维特征；
良好的特征解释能力（支持SHAP分析）；
较强的泛化能力，适合时间序列预测任务。

训练集与测试集采用时间前向划分（2015-2022为训练，2023-2024为测试），并使用 Optuna + GridSearchCV 联合调参，评估指标为 RMSE。

六、模型表现与评估

在测试集上的表现如下：

指标	值	评价
RMSE	0.3154°C	极佳
MAE	0.2770°C	极佳
R²	0.9956	极高解释力

SHAP分析结果揭示出 temperature_div_co2、temperature_mul_co2 和 month_cos 是影响预测结果的核心变量。

残差分析、正态性检验、异方差检验均通过，表明模型稳定可靠。

七、研究意义与应用价值

本研究成果可为以下领域提供支持：

区域气候政策制定：基于预测结果科学设定减排目标；
极端天气预警系统：提升应对极端气候事件的准备能力；
碳排放评估与模拟：结合CO₂浓度变化对气温响应进行模拟与推演。

八、后续工作展望

增加更多气候因子（如湿度、风速、降水）以提升模型多维解释性；
引入深度学习模型（如Temporal Fusion Transformer, Graph Neural Networks）进行对比研究；
在更小空间尺度（如中国、四川、成渝）进行区域性建模，提高政策精度。

Mechine Learning

#Climate #Temperature #Prediction

基于ERA5再分析数据的亚太地区气温短期预测研究报告

https://jpl-hub.github.io/2025/12/20/基于ERA5再分析数据的亚太地区气温短期预测/

作者

James

发布于

2025年12月20日

许可协议

Hello World 上一篇