基于ERA5再分析数据的亚太地区气温短期预测研究报告

一、研究背景与动机

近年来,全球气候变暖趋势日益显著,极端气候事件频发,对生态环境和社会经济造成了巨大影响。亚太地区作为全球人口最密集、经济最活跃的区域之一,其气候变化状况不仅影响本区域,也具有全球性意义。因此,提升该地区气温变化趋势的预测精度,对制定科学合理的气候政策具有重要意义。

本研究聚焦于2015年至2024年间亚太地区的气温变化趋势,基于ERA5再分析数据,并结合大气CO₂浓度与ENSO(厄尔尼诺-南方涛动)指数,构建气温短期预测模型。

二、数据来源与处理

本研究使用的主要数据包括:

  • ERA5气温数据:来自欧洲中期天气预报中心(ECMWF),时空分辨率高,涵盖2015-2024年亚太区域。
  • CO₂浓度数据:来自NOAA,选取Mauna Loa站的全球代表性月度均值。
  • ONI(ENSO)指数:用于表征厄尔尼诺/拉尼娜事件的强度与状态。

数据预处理步骤包括:

  • 清洗与异常值检测
  • 标准化处理(Z-score)
  • 时间对齐(特别是ONI跨年的季节码)

三、探索性分析与变量关联

  • 使用可视化(箱线图、热力图、散点图)揭示温度、CO₂浓度、ENSO指数之间的关系;
  • 相关性分析表明,在去除季节性因素后,CO₂浓度与温度异常呈中等正相关(r≈0.4),ENSO与温度异常相关性略低但仍显著;
  • 时间序列分解表明,气温变化中**趋势成分占比约60%**,季节性成分约35%,残差成分约5%。

四、特征工程与建模输入

我们设计并筛选了14个输入特征,包括:

  • 时间与周期特征:如 month_cosseason_sin
  • 滞后特征:如 temperature_lag_1temperature_lag_12
  • 滚动统计特征:如 temperature_rolling_mean_3
  • 交互特征:如 temperature_div_co2(单位CO₂浓度下温度),temperature_mul_co2

最终特征在控制冗余与共线性后,保留了对预测贡献最大的特征集。

五、模型选择与训练方法

我们选用 LightGBM 作为主模型,理由包括:

  • 强大的非线性建模能力;
  • 高效处理高维特征;
  • 良好的特征解释能力(支持SHAP分析);
  • 较强的泛化能力,适合时间序列预测任务。

训练集与测试集采用时间前向划分(2015-2022为训练,2023-2024为测试),并使用 Optuna + GridSearchCV 联合调参,评估指标为 RMSE。

六、模型表现与评估

在测试集上的表现如下:

指标 评价
RMSE 0.3154°C 极佳
MAE 0.2770°C 极佳
0.9956 极高解释力

SHAP分析结果揭示出 temperature_div_co2temperature_mul_co2month_cos 是影响预测结果的核心变量。

残差分析、正态性检验、异方差检验均通过,表明模型稳定可靠。

七、研究意义与应用价值

本研究成果可为以下领域提供支持:

  • 区域气候政策制定:基于预测结果科学设定减排目标;
  • 极端天气预警系统:提升应对极端气候事件的准备能力;
  • 碳排放评估与模拟:结合CO₂浓度变化对气温响应进行模拟与推演。

八、后续工作展望

  • 增加更多气候因子(如湿度、风速、降水)以提升模型多维解释性;
  • 引入深度学习模型(如Temporal Fusion Transformer, Graph Neural Networks)进行对比研究;
  • 在更小空间尺度(如中国、四川、成渝)进行区域性建模,提高政策精度。

基于ERA5再分析数据的亚太地区气温短期预测研究报告
https://jpl-hub.github.io/2025/12/20/基于ERA5再分析数据的亚太地区气温短期预测/
作者
James
发布于
2025年12月20日
许可协议