編輯 | KX
地球正以前所未有的方式變暖,但氣溫升高對我們的未來意味著什麼尚不完全清楚。全球哪些地區將面臨長期乾旱?大型熱帶風暴將使哪些沿海地區的洪災更加頻繁?為了回答這些問題,科學家需要能夠準確預測地球氣候。
現在,Google Research 研究團隊提出一種將傳統的基於物理建模與 ML 相結合的新方法——NeuralGCM,可以準確高效地模擬地球大氣層。比現有模型更快、計算成本更低、更準確。
NeuralGCM 可以生成 2-15 天的天氣預報,比目前基於物理的「黃金標準」模型更準確。在 1 至 10 天預報方面與機器學習模型相媲美,在 1 至 15 天預報方面與歐洲中期天氣預報中心的集合預報相媲美。
所得到的模型非常快速且準確,在相似或更高準確度下,計算效率比當前最先進的模型高出 3 到 5 個數量級。
相關研究以「Neural general circulation models for weather and climate」為題,於 7 月 22 日釋出在《Nature》上。
論文連結:https://www.nature.com/articles/s41586-024-07744-y
NeuralGCM 架構
NeuralGCM 將基於物理的大氣迴圈模型與用於小規模過程的神經網路相結合。
NeuralGCM 的兩個關鍵組成部分是:一個可微分的動力學 core,用於求解離散化的動力學控制方程;以及一個使用神經網路引數化物理過程的學習物理模組。
動力學 core 模擬在重力和科里奧利力(Coriolis Force)作用下大尺度流體運動和熱力學過程。學習物理模組利用神經網路預測未解決過程對模擬場的影響,如雲的形成、輻射傳輸、降水和亞網格尺度動力學。
圖示:NeuralGCM 模型的結構。(來源:論文)
NeuralGCM 中的可微分動力學 core 允許採用端到端訓練方法,即在採用隨機梯度下降之前將模型推進多個時間步驟,以儘量減少模型預測和重新分析之間的差異。透過數百個模擬步驟的擴充套件反向傳播使神經網路能夠考慮學習到的物理和動力學核心之間的相互作用。訓練確定性和隨機性 NeuralGCM 模型,每個模型都使用不同的訓練協議。
研究訓練了一系列水平解析度的 NeuralGCM 模型,網格間距為 2.8°、1.4° 和 0.7°。在適合天氣預報和氣候模擬的一系列時間尺度上評估了 NeuralGCM 的效能。
NeuralGCM 轉變氣候建模
與傳統模型一樣,NeuralGCM 將地球大氣層劃分為立方體,並對空氣和水分運動等大規模過程進行物理計算。但它不是依靠科學家制定的引數化來模擬雲形成等小規模方面,而是使用神經網路從現有天氣資料中學習這些事件的物理特性。
NeuralGCM 的一項關鍵創新是,研究人員在 JAX 中從頭開始重寫了大規模過程的數值求解器。這使其能夠使用基於梯度的最佳化在多個時間步驟上「線上」調整耦合系統的行為。
相比之下,之前使用 ML 增強氣候模型的嘗試在數值穩定性方面遇到了很大困難,因為它們使用了「離線」訓練,忽略了隨著時間的推移而積累的小規模和大規模過程之間的關鍵反饋。在 JAX 中編寫整個模型的另一個好處是它可以在 TPU 和 GPU 上高效執行,而傳統的氣候模型主要在 CPU 上執行。
圖示:NeuralGCM 將傳統的流體動力學求解器與用於小規模物理的神經網路相結合。這些元件由微分方程求解器組合,使系統在時間上按順序向前推進。(來源:Google Research)
研究人員使用 ECMWF 1979 年至 2019 年的天氣資料(解析度為 0.7°、1.4° 和 2.8°)訓練了一套 NeuralGCM 模型。雖然該模型是根據天氣預報進行訓練的,但將 NeuralGCM 設計成通用大氣模型。
準確的天氣預報和氣候預測
迄今為止,ML 預測研究主要集中在短期預報上,遠遠低於氣候預測所需的幾年到幾十年的時間。由於難以對數十年的氣候預測進行穩健驗證,研究人員使用已建立的 WeatherBench 2 基準對氣候尺度預測以及天氣模型對 NeuralGCM 進行了評估。
NeuralGCM 的確定性模型在 0.7° 解析度下的效能與當前最先進的模型相當,天氣預報準確率可達 5 天。
NeuralGCM 的 1.4° 解析度集合模型在 5 到 15 天的預測精度方面優於之前最先進的模型。這是由於 NeuralGCM 能夠產生與 ECMWF 最先進的基於物理的模型 ECMWF-ENS 相媲美的集合天氣預報,而 NeuralGCM 是第一個基於 ML 的模型。
在 2-15 天的預報中,NeuralGCM 集合的準確性在 95% 的時間內優於 ECMWF-ENS。
NeuralGCM 在氣候時間尺度的預測方面也優於最先進的大氣模型。由於 NeuralGCM 僅模擬地球氣候的大氣成分,因此將其效能與基於物理的大氣模型進行了比較。在預測 1980 年至 2020 年間的 40 年間的溫度時,NeuralGCM 的 2.8° 確定性模型的平均誤差是氣候模型比對專案的僅大氣模型 (AMIP) 的三分之一——0.25 攝氏度對 0.75 攝氏度。
圖示:比較 NeuralGCM 和 AMIP 在預測 1980 年至 2020 年期間 1000 hPa 全球平均氣溫方面的表現。全球平均氣溫 (C) 來自 ECMWF 再分析 v5 ERA5 資料集。(來源:Google Research)
由於傳統大氣模型難以模擬地球大氣的某些方面,氣候科學家有時會使用 X-SHiELD 等更高解析度的模型,這些模型更準確,但計算成本較高。與 X-SHiELD 相比,NeuralGCM 的 1.4° 確定性模型在預測 2020 年的溼度和溫度資料時誤差減少了 15-50%,2020 年的資料是美國國家海洋和大氣管理局 (NOAA) 研究人員提供的一年的資料。
在 2020 年的氣候模擬中,NeuralGCM 還預測了與當年在同一地區觀測到的風暴數量和強度相匹配的熱帶氣旋模式。NeuralGCM 是第一個能夠生成此類模式的基於 ML 的模型。
影片連結:https://mp.weixin.qq.com/s/niZ_CpF1cI-2_dCzqdUanQ
NeuralGCM 預測了 2020 年全球熱帶氣旋的路徑。預測的風暴與 ECMWF 再分析 v5(ERA5)資料集中顯示的當年實際氣旋的數量和強度相匹配。(來源:Google Research)
開源、快速、高效的模型
NeuralGCM 比傳統的 GCM 節省了幾個數量級的計算量,計算成本也更低。
NeuralGCM 的 1.4° 模型比 X-SHiELD 快 3,500 倍以上,這意味著如果研究人員使用 X-SHiELD 模擬一年的大氣,需要 20 天,而使用 NeuralGCM 只需 8 分鐘。
雖然科學家只需要一臺帶有單個 TPU 的計算機即可執行 NeuralGCM,但他們需要請求訪問具有 13,000 個 CPU 的超級計算機才能執行 X-SHiELD。
總體而言,使用 NeuralGCM 進行氣候模擬的計算成本比使用 X-SHiELD 低 100,000 倍,速度的提高相當於高效能運算 25 年的進步。
影片連結:https://mp.weixin.qq.com/s/niZ_CpF1cI-2_dCzqdUanQ
NeuralGCM 可以比最先進的物理模型更快地模擬大氣,同時以相當的精度生成預測。(來源:Google Research)
研究人員已將 NeuralGCM 的原始碼和模型權重在 GitHub 上公開,供非商業使用。
開源地址:https://github.com/google-research/neuralgcm
此外,由於 NeuralGCM 可以在膝上型電腦上執行,而不需要超級計算機,研究人員希望更多的氣候研究人員可以在他們的工作中使用這種最先進的模型。
未來方向
NeuralGCM 目前僅模擬地球大氣層。研究人員希望最終將地球氣候系統的其他方面(例如海洋和碳迴圈)納入模型。這樣,NeuralGCM 將在更長的時間尺度上進行預測,而不僅僅是預測幾天和幾周的天氣,而是在氣候時間尺度上進行預測。
NeuralGCM 提出了一種構建氣候模型的新方法,這種方法可能比現有模型更快、計算成本更低、更準確。
基於物理定律和經驗關係的模型在科學中無處不在。研究人員相信 NeuralGCM 的可微分混合建模方法有潛力將模擬技術轉化為廣泛的應用,例如材料發現、蛋白質摺疊和多物理工程設計。
參考內容:
https://research.google/blog/fast-accurate-climate-modeling-with-neuralgcm/
https://x.com/GoogleAI/status/1815419503230287969
https://x.com/shoyer/status/1815453653710631271