基于ERA5再分析数据的亚太地区气温短期预测研究报告
一、研究背景与动机
近年来,全球气候变暖趋势日益显著,极端气候事件频发,对生态环境和社会经济造成了巨大影响。亚太地区作为全球人口最密集、经济最活跃的区域之一,其气候变化状况不仅影响本区域,也具有全球性意义。因此,提升该地区气温变化趋势的预测精度,对制定科学合理的气候政策具有重要意义。
本研究聚焦于2015年至2024年间亚太地区的气温变化趋势,基于ERA5再分析数据,并结合大气CO₂浓度与ENSO(厄尔尼诺-南方涛动)指数,构建气温短期预测模型。
二、数据来源与处理
本研究使用的主要数据包括:
- ERA5气温数据:来自欧洲中期天气预报中心(ECMWF),时空分辨率高,涵盖2015-2024年亚太区域。
- CO₂浓度数据:来自NOAA,选取Mauna Loa站的全球代表性月度均值。
- ONI(ENSO)指数:用于表征厄尔尼诺/拉尼娜事件的强度与状态。
数据预处理步骤包括:
- 清洗与异常值检测
- 标准化处理(Z-score)
- 时间对齐(特别是ONI跨年的季节码)
三、探索性分析与变量关联
- 使用可视化(箱线图、热力图、散点图)揭示温度、CO₂浓度、ENSO指数之间的关系;
- 相关性分析表明,在去除季节性因素后,CO₂浓度与温度异常呈中等正相关(r≈0.4),ENSO与温度异常相关性略低但仍显著;
- 时间序列分解表明,气温变化中**趋势成分占比约60%**,季节性成分约35%,残差成分约5%。
四、特征工程与建模输入
我们设计并筛选了14个输入特征,包括:
- 时间与周期特征:如
month_cos、season_sin - 滞后特征:如
temperature_lag_1、temperature_lag_12 - 滚动统计特征:如
temperature_rolling_mean_3 - 交互特征:如
temperature_div_co2(单位CO₂浓度下温度),temperature_mul_co2等
最终特征在控制冗余与共线性后,保留了对预测贡献最大的特征集。
五、模型选择与训练方法
我们选用 LightGBM 作为主模型,理由包括:
- 强大的非线性建模能力;
- 高效处理高维特征;
- 良好的特征解释能力(支持SHAP分析);
- 较强的泛化能力,适合时间序列预测任务。
训练集与测试集采用时间前向划分(2015-2022为训练,2023-2024为测试),并使用 Optuna + GridSearchCV 联合调参,评估指标为 RMSE。
六、模型表现与评估
在测试集上的表现如下:
| 指标 | 值 | 评价 |
|---|---|---|
| RMSE | 0.3154°C | 极佳 |
| MAE | 0.2770°C | 极佳 |
| R² | 0.9956 | 极高解释力 |
SHAP分析结果揭示出 temperature_div_co2、temperature_mul_co2 和 month_cos 是影响预测结果的核心变量。
残差分析、正态性检验、异方差检验均通过,表明模型稳定可靠。
七、研究意义与应用价值
本研究成果可为以下领域提供支持:
- 区域气候政策制定:基于预测结果科学设定减排目标;
- 极端天气预警系统:提升应对极端气候事件的准备能力;
- 碳排放评估与模拟:结合CO₂浓度变化对气温响应进行模拟与推演。
八、后续工作展望
- 增加更多气候因子(如湿度、风速、降水)以提升模型多维解释性;
- 引入深度学习模型(如Temporal Fusion Transformer, Graph Neural Networks)进行对比研究;
- 在更小空间尺度(如中国、四川、成渝)进行区域性建模,提高政策精度。
基于ERA5再分析数据的亚太地区气温短期预测研究报告
https://jpl-hub.github.io/2025/12/20/基于ERA5再分析数据的亚太地区气温短期预测/