众所周知,传统天气预报的可靠性,多少都有些一言难尽。

图片

最近,DeepMind和谷歌新研究出了一种基于机器学习的天气模拟器,可以在60秒内预测10天内的天气,而且准确率极高!
图片论文地址:https://arxiv.org/abs/2212.12794
1. GraphCast是一种基于图神经网络的自回归模型,性能优于世界上最准确的机器学习天气预报系统(中期天气预报);
2. GraphCast只需单台Cloud TPU v4设备,即可在60秒内生成10天内的天气预报(35GB数据),分辨率高达0.25°;
3. 通过在更大、更新、质量更高的数据上进行训练,可以进一步提升GraphCast预测的速度和准确性。
而在短期天气预报方面,DeepMind曾于2021年9月在Nature上发文称,其生成模型能以89%的绝对优势吊打其他方法。

中期天气预报为什么那么难

「中期天气预报」通常是指对未来于4至10天内天气变化趋势的预报。其准确性,对于农业、建筑业、旅游业等行业的政策制定来说至关重要。

为此,国际领先的欧洲中期天气预报中心(ECMWF), 每天都会提供多达四次的中期天气预报。
在中期天气预报的制作过程中,有两个关键的组成部分都需要利用大规模高性能计算(HPC)集群进行模拟:
  • 通过分析由卫星、气象站、船舶等收集的当前和历史数据来预测天气状况,也就是「数据同化」;
  • 通过数值天气预报(NWP)系统建立预测天气相关变量将如何随时间变化的模型。
图片
然而,随着数据量的显著增加,NWP模型却无法得到有效的扩展。
也就是说,虽然现在有大量的天气和气候观测档案,但我们却很难直接利用这些数据来提高预报模型的质量。
而改进NWP的方法,一般是由训练有素的专家手动创造更好的模型、算法和近似值,这个过程耗时耗力,成本高昂。
相比之下,基于机器学习方法可以利用更多、更高质量的可用数据来提高模型的准确性,而且计算预算通常要低得多。

GraphCast

在论文「GraphCast:中期全球天气准确预报学习」中,DeepMind以「编码-处理-解码」的方式使用图神经网络(GNN)来创建一个自回归模型。

GraphCast的三阶段模拟过程如下:
1. 使用从网格点到多网格的有向边的GNN,将原始经纬度网格的输入数据映射到多网格上的学习特征中;
2. 一个深度GNN被用来在多网格上进行学习的信息传递,其中长距离的边允许信息在空间上有效传播;
3. 解码器将最终的多网格表示映射回经纬度网格,并执行任何必要的操作。
研究结果显示,GraphCast的性能在252个变量中,有99.2%超过了现有最准确的机器学习天气预报模型;在2760个变量中,有90%超过了欧洲气象中心的高精度预报(ECMWF HRES Forecast)。

内容中包含的图片若涉及版权问题,请及时与我们联系删除