基于人工智能的大型天气模型:进展、对比与展望
本文系统综述了人工智能大型天气模型(LWMs)的技术架构、核心性能及未来发展方向。文章将主流模型按预报时效分为四类:临近预报(NowCastNet/FengLei)、短期预报(MetNet-3)、中期预报(FourCastNet/Pangu)和延伸期预报(GraphCast/FengWu/FuXi)。相比传统数值天气预报(NWP),AI模型在计算效率(提速万倍以上)、时空分辨率(公里级/分钟级)和多样化应用场景方面展现巨大优势。然而,模型可解释性、训练成本、极端事件预测和平滑效应等挑战仍待解决。未来发展方向在于物理模型与AI的深度融合,构建"物理约束+数据驱动"的混合预报范式。
Lei Hu, Zhen Ma, and Huijin Fu. 2026.
Artificial Intelligence-Based Large Weather Models:
Advances, Comparisons, and Prospects.
In Proceedings of the 2025 International Conference
on Embodied Intelligence and Large Models (EILM '25).
Association for Computing Machinery, New York, NY,
USA, 191–198. https://doi.org/10.1145/3788731.3788761一、研究背景与范式转变 1.1 传统数值天气预报的困境 现代气象预报业务主要依赖**数值天气预报(NWP, Numerical Weather Prediction)**方法,以欧洲中期天气预报中心(ECMWF)的集合预报系统为典型代表。NWP基于大气物理学原理,通过求解描述大气状态演变的偏微分方程组来预测未来天气。然而,这一范式面临两大固有局限:
• 计算成本高昂 :单次全球10天预报通常需要在配备数百个节点的超级计算机上运行数小时 • 参数化误差 :对次网格尺度物理过程(如云微物理、边界层湍流)的参数化近似是预报误差的重要来源 1.2 AI气象预报的新范式 近年来,人工智能与大气科学的深度融合催生了**大型AI天气模型(Large Weather Models, LWMs)**这一新范式。通过直接在海量历史气象数据集(如ERA5再分析资料)上训练深度神经网络(LSTM、Transformer等),AI模型能够学习大气系统的内在演变规律。
核心优势 :
• 推理速度 :训练后的模型可在秒级至分钟级内生成高分辨率预报 • 数据驱动 :直接从观测数据学习,预测结果更接近大气真实状态 • 时空分辨率 :可实现公里级空间分辨率和分钟级时间分辨率 二、大型AI天气模型的技术架构与分类 基于预报时效,主流大型AI天气模型可分为四类:
2.1 短期临近预报模型(Nowcasting,0-3小时) 核心挑战 :强风暴、暴雨等强对流天气的准确早期预警对时效性和空间精度要求极高。
NowCastNet(清华大学,2023) :
• 技术架构 :结合神经演化算子(Neural Evolution Operator)与概率生成模型 • 性能指标 :3小时降水预报,空间分辨率20km,时间分辨率10分钟 • 创新点 :端到端建模降水相关物理过程,捕捉公里尺度降水结构 • 业务应用 :已部署于中国气象局短临预报业务平台(SWAN 3.0) FengLei(风雷)模型(2024) :
• 技术升级 :融合物理模式的中尺度预报与AI模型的对流尺度预报 • 性能提升 :0-3小时公里级雷达反射率预报技巧提升25%,强回波预报技巧提升显著 • 时效性 :3分钟内生成6小时间隔预报产品 • 典型案例 :2024年成功预报湖南地区飑线合并过程,提前3小时提供预警 2.2 短期预报模型(Short-Range,0-24小时) MetNet系列(Google/DeepMind) :
• MetNet(2020) :基于深度神经网络,利用雷达和卫星高分辨率观测数据,提供1km空间分辨率、2分钟时间分辨率、最长8小时预报 • MetNet-2(2022) :扩展至12小时预报,但仍存在漏报和空报 • MetNet-3(2023) :采用U-Net骨干网络,集成MaxViT模块与Transformer架构,引入网格注意力机制• 突破 :关键大气变量有效预报时效延长至24小时,精度超越传统NWP • 业务化 :已部署于Google Search等 operational 系统 局限性 :纯数据驱动策略在融入物理约束和提升可解释性方面仍有改进空间。
2.3 中期预报模型(Medium-Range,1-7天) FourCastNet(NVIDIA等,2022) :
• 核心技术 :基于自适应傅里叶神经算子(AFNO, Adaptive Fourier Neural Operator) • 训练数据 :ERA5再分析数据集(20+气象变量,1979-2017年) • 性能表现 :• 0.25°分辨率全球7天预报仅需约2秒 • 预报速度比ECMWF IFS高分辨率集合预报快约45,000倍 • 大尺度变量预报技巧与IFS相当,部分小尺度变量超越IFS • 范式 :"预训练+微调"(Pretraining + Fine-tuning),支持端到端下游任务 盘古气象大模型(Pangu,华为云,2022) :
• 架构创新 :基于3D Earth-Specific Transformer (3D Swin Transformer) • 技术特点 :• 纯数据驱动,完全替代传统模式的动力核心和参数化方案 • 全球7天预报耗时仅1.4秒,比传统方法快约10,000倍 • 首次在精度上超越传统NWP方法(2023年7月发表于Nature) • 误差控制 :采用分层时间聚合策略(Hierarchical Temporal Aggregation),减少多步迭代误差累积 2.4 延伸期预报模型(Extended-Range,7-15天) GraphCast(DeepMind/Google,2022) :
• 核心架构 :基于**图神经网络(GNN)**的自回归预报模型 • 网格映射 :将原始经纬度网格映射为多网格表示(Multi-grid Representation)进行特征学习 • 性能表现 :• 60秒内完成10天全球预报 • 在252个大气变量中,99.2%的评估指标超越Pangu • 在2760个变量中,90%的预报技巧超越ECMWF HRES • 37个气压层,0.25°分辨率,约25km×25km赤道附近水平分辨率 • 发表 :2023年11月发表于Science 风乌(FengWu,上海AI实验室,2023) :
• 技术突破 :• 多任务学习 :将大气变量间复杂相互作用建模为多任务学习问题,采用多模态神经网络架构与自动损失重平衡 • 回放缓冲区机制(Replay Buffer) :收集并重用训练中的中间步预测,显式模拟并校正多步误差,无需额外自回归训练阶段 • 性能指标 :• 首个将全球中期有效预报时效延长至10.75天 的模型 • 风乌-GHR(2024) :首个实现公里级(约9km,0.09°)全球中期AI直接预报,空间细节提升7倍以上,有效预报时效达11.25天 伏羲(FuXi,复旦大学,2023) :
• 模型规模 :45亿参数 • 核心贡献 :将AI天气预报有效预报时效延伸至15天 ,进入次季节-季节(S2S)尺度 • 级联架构 :FuXi Short(0-20天)、FuXi Medium(21-40天)、FuXi Long(长期) • 性能表现 :• 10天预报(6小时间隔,0.25°分辨率)超越ECMWF确定性HRES预报 • 15天预报性能与ECMWF集合平均(EM)相当 • 伏羲2.0 :提升至0.1°分辨率,小时级15天预报 三、大型AI天气模型的核心优势 3.1 预报效率的指数级提升 传统NWP需要超级计算机运行数小时,而AI模型可在秒至分钟级生成预测。FourCastNet和盘古等模型相比传统NWP提速4个数量级以上 ,为临近预报和早期预警争取宝贵时间。
3.2 时空分辨率的显著增强 主流AI模型可实现1-25km空间分辨率 和2分钟时间分辨率 ,远超传统NWP。这支持对局地深对流、城市热岛效应等小尺度过程的精细刻画,为城市洪涝、能源调度等精细化管理提供支撑。
3.3 多样化应用场景的强适应性 从台风、暴雨等极端事件早期预警,到高铁横风预报、机场风切变预警,再到城市内涝、能源调度等公共服务领域,大型AI天气模型可灵活适配多种下游任务。
四、挑战与未来展望 4.1 模型可解释性(Interpretability) 深度学习模型常被视为"黑箱",其内部决策过程和物理机制难以解释。在需要严格物理论证的气象领域,这构成重大挑战。未来方向 :探索理论驱动与数据驱动融合的新范式,将物理约束嵌入AI模型,研究其可解释性与物理一致性。
4.2 训练成本与泛化能力 虽然训练后的AI模型运行成本低,但训练过程需要大量计算资源(如盘古使用数千GPU训练),在这方面相比NWP并无明显优势。解决路径 :
• 显著降低前期训练成本 • 增强模型泛化能力,实现跨区域、跨时段的有效迁移 4.3 过度平滑与极端事件预测 现有模型在极端事件预报方面能力有限。作为统计模型,AI模型存在**过度平滑(Over-smoothing)**问题:预报输出严重偏向训练数据分布,对罕见的极端事件预测能力显著不足。解决方案 :结合NWP与AI模型,互补优势。
4.4 实施框架差异 传统NWP主要使用Fortran编写,而AI模型基于Python和TensorFlow/PyTorch等深度学习框架。两者的深度集成成为地球系统建模的核心前沿。
4.5 业务化挑战 • 预报员信任 :黑箱系统缺乏可解释性可能阻碍业务环境接受度 • 监管验证 :官方天气预报的法规认证要求严格 • 系统集成 :需与现有NWP集合预报系统协同,而非简单替代 五、结论 大型AI天气模型凭借其卓越的效率和分辨率,正引领天气预报向数据驱动方法与物理约束混合框架 的范式转变。其在临近预报、中期预报和延伸期预报方面的突破,已为防灾减灾和社会经济发展提供关键支撑。
然而,在可解释性、泛化能力、极端事件预报和训练成本方面仍存在显著障碍。未来发展路径在于物理模型与AI模型的深度融合 、训练优化和互操作性提升。这些进步有望重新定义预报精度和时效的极限,使大型AI天气模型成为地球系统建模的基石和未来智能气象业务的核心引擎。
以上是对文章的详细解读,如有不当之处欢迎批评指出!
END
声明: 欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。