Google釋出全球天氣模型預報基準WeatherBench 2，推動機器學習氣象應用發展

Google釋出了一個用於評估和比較各種天氣預報模型的框架WeatherBench 2，該框架可以計算包括機器學習模型和物理模型的天氣預測分數，使研究人員有微調和改進模型的依據。官方還開源WeatherBench 2評估程式碼，以及針對雲端最佳化的真實資料和基準資料集。

由於天氣預測技術的發展發向，正從物理模型逐漸轉移到機器學習模型，因此需要模型基準來評估模型間的能力，並確保機器學習模型值得信任。隨著運算能力提升，Google提到，當今7日天氣預報的準確性，相當於2000年的5日預報，也相當於1980年的3日預報，這些預測準確度的提升，對物流規畫、災害管理、農業甚至是能源，都有極大的價值。

不過，除了運算能力的提升外，當前另一股天氣預測的變革從演算法開始，較新的方法是使用機器學習技術，透過查看大量過去的天氣資料，預測接下來天氣的變化，有別於現行基於物理模型的天氣預測，是以數學方程式描述和模擬大氣、海洋、陸地和相關過程的動態和互動。

機器學習天氣預測目前已經有部分成果，像是Google DeepMind所開發的圖神經網路GraphCast，就可以在25公里的水平解析度下，預測10日天氣，結果也已經可以和先進的物理模型相比較。

機器學習模型的重要優勢，在於模型經過訓練之後，可以僅使用成本遠低於超級電腦的硬體運算，在數分鐘內計算出結果，而這對天氣預報領域帶來重大的效率提升和成本降低的可能性，因此無論是在歐洲中期天氣預報中心（ECMWF）的機器學習發展路線，還是美國國家海洋暨大氣總署（NOAA）的人工智慧戰略都可見端倪。

在發展機器學習天氣預測上，需要一個能夠反應天氣和下游應用各面性質的基準，而且能夠以公平且可重複的方式比較新舊模型。Google所推出的WeatherBench 2全球天氣模型基準，可提供一個可信、可重複的框架，評估和比較不同的預測方法。目前WeatherBench 2官方網站公開的模型比較，包含Keisler、GraphCast和Pangu-Weather機器學習模型，還有一些ECMWF高解析度整合預報系統，作為傳統天氣預報模型的代表。

天氣預報的評估存在一些挑戰，因為高解析度的天氣預報資料可能非常龐大，因此Google在開源統一程式開發模型Apache Beam上建置評估程式碼，供用戶將運算分割成小區塊，以分散式的方式進行評估。另外，Google針對不同解析度，並以雲端最佳化的資料格式，提供用來訓練大多數機器學習模型的ERA5資料集，官方提到，因為從各別檔案下載資料並進行轉換，非常耗時且需要大量運算資源，因此透過公開已經就緒的資料，可以大幅降低研究進入門檻。

Google與ECMWF合作，共同定義了天氣預報品質評分指標，更好地捕捉全球天氣預報的品質，WeatherBench 2能夠以同一標準評估不同的模型，包括機器學習模型與物理模型。除此之外，WeatherBench 2也考慮到更先進的概率預測，提供概率指標和基準。

比起傳統「明天下雨機率80％」，概率預測可以提供不同情境下的概率分布，像是「明天降雨量在0-10毫米的機率為60%，10-20毫米的機率為20%」這類預測，以捕捉更多天氣預報的不確定性。

同時，WeatherBench 2也針對機器學習預測的限制，提供研究範例，Google解釋，機器預測模型相對物理模型，在大氣不確定性上傾向採取保守策略，這會讓預測更為平滑（下圖），因此與真實情況不一致缺乏真實性，同時缺乏小尺度的結構。WeatherBench 2對此提供了研究範例，並且添加光譜指標來量化模型的模糊性，以評估模型是否傾向預測平滑的場景。

研究人員仍會繼續完善WeatherBench 2，添加包括站點觀測和降水資料集，並且嘗試將臨近預報和次季節預測納入基準中。

熱門新聞