這個夏天,天氣版「山東卷」考驗電網,達摩院氣象大模型成功通關
机器之心發表於2024-11-06
3 月,江西南昌持續遭遇強對流天氣,大樹被連根拔起,民宅玻璃被吹落;9 月,上海的小夥伴在一週之內迎來了兩次颱風,高呼「活久見」。十一假期之前,內蒙古呼倫貝爾突降暴雪,前去「賞秋」的遊客被打得措手不及。而且,Nature 子刊的一篇文章顯示,在未來的 20 年,這種極端天氣有迅速加強的趨勢。其實,對「風雲突變」的威力,有些行業早就深有感受,甚至是深受其苦。電網就是這樣一個場景。無論是從發電端還是用電端來看,天氣的劇烈變化都會直接影響電力供需平衡,給電網執行帶來意想不到的挑戰。好在,AI 正在上崗天氣預報員,帶給電力系統高頻更新的專屬天氣預報。在國網山東電力調控中心,一個名叫「八觀」的氣象大模型已經執行了好幾個月,以每小時公里級的精準度成功預測了多次極端天氣,幫助電網平穩度過了一個「旱澇急轉」的夏天。這位優秀的 AI 天氣預報員是什麼來頭?在 11 月 6 日北京舉行的達摩院決策智慧產品釋出會上,相關謎底被揭開。今天夏天,家住山東的朋友或許都感受到了天氣的反常:先是高溫持續、旱情嚴峻;緊接著旱澇急轉、暴雨頻發。我們想象一下小學應用數學題裡一邊注水一邊放水的泳池。電網就像這個泳池,一邊在發電,一邊在用電,而且「水位」要始終保持平衡。先說用電側。最直觀的,下雨前天氣悶熱,更多的居民會選擇開空調。溫度每升高一度,對應的用電量,專業上叫做「負荷」就會相應增加。但如果雨下下來,天氣一涼爽,用電負荷就會驟降。偏偏今年夏天山東降雨特別多,是有資料統計以來第二多的。8 月 25 日至 28 日,山東的氣溫就因為降水出現大幅度波動,電網負荷總量在 3 日之內下降了 20%。要知道,電網在高負荷狀態下需要維持充足的電力供應以避免停電風險,而突如其來的需求減少可能導致電力過剩,引發電壓不穩定、頻率波動等問題。再說發電側。和傳統的火力發電不同,風電、光伏「看天吃飯」,發電功率隨天氣變化而波動。尤其這類新能源發電裝置多是分散式的,受區域天氣影響很大。新能源裝機、併網規模不斷攀升,給電網注入了更多隨機性、波動性和間歇性因素。這樣一來,天氣一變,電網就會兩頭承壓。要是來不及制定合理的排程策略,牽一髮而動全身,就有可能排程失衡。據統計,我國新能源裝機佔比已經超過 40%。要保證大規模的分散式光伏和風電安全穩定地接入電網,高頻、高精度的區域天氣預報變得尤為關鍵。執行在國網山東電力調控中心的「八觀」是由阿里巴巴達摩院決策智慧實驗室開發的一個氣象大模型。這也是八觀上崗的第一份「工作」。根據這份工作的需求,它不僅需要提供天氣預報,更要幫助電力系統在氣象資料基礎上,提供新能源發電功率預測和用電負荷預測。為此,八觀進行了多個方面的技術創新。首先,它採取了「全球 - 區域」協同的預測策略,在模型層面和資料層面取長補短。在「八觀」之前,很多研究機構都基於歐洲氣象局的 ERA5 再分析資料訓練,推出了所謂的「全球氣象大模型」。但全球氣象大模型距離真正的落地還存在 gap。ERA5 的資料質量很高,但時空解析度只有 0.25(25 公里 X25 公里的網格 ),無法滿足包括電力系統在內的很多行業使用者的實際需求。為此,達摩院訓練了兩個氣象大模型 —— 一個全球大模型和一個區域大模型。全球大模型作為底座模型,學習大氣運動在時空上的宏觀規律,區域大模型則納入了包括場站資料、氣象實況、開源衛星影像、開源地形在內的多源多模態資料。這些資料與描述天氣特徵的物理模型約束相互融合,共同對次網格尺度的區域性微氣象過程進行精細化建模。具體來說,達摩院研發人員透過對不同空間解析度但對應相同實際地域的各種資料嵌入表徵的對齊,讓全球模型表徵和區域模型表徵在各層中相互互動,將其預測精度最高提升至 1 公里 * 1 公里 * 1 小時。在氣象大模型架構方面,不同於 Swin Transformer、GNN 等架構,達摩院率先採用孿生掩碼自編碼器(MAE)。此類架構的原理是隨機掩蓋輸入資料,然後訓練 AI 去重建這些被掩蓋的部分。比如,可在時間上取 2 個點(6 小時前和 6 小時後),在空間上將地球劃分為多個小區域,掩蓋(mask)一些區域。模型透過學習 6 小時前的氣象資料和 6 個小時後沒有被掩蓋的區域來重建 6 小時後的掩蓋區域,從而學習隱藏在高波動的天氣資料下的魯棒特徵表示,實現對天氣的精準把握。這種架構不僅能為天氣預報提供可靠的基礎模型,還能支援更長時段的次季節(42 天)預測,而且能夠充分考慮更多的資料(如海洋資料)。 最後,「八觀」還對風速、輻照度等新能源重點指標進行了最佳化。在這些技術創新的加持下,「八觀」氣象大模型在山東經受住了考驗,在前面提到的 8 月 25 日至 8 月 28 日的劇烈變化中,將下游新能源發電功率、電力負荷預測準確率分別提升至 96.5% 和 98.1%,有效幫助電力系統作出及時、準確的排程決策。相比起傳統的數值天氣預報計算量龐大,需要配置機房,AI 氣象大模型部署便捷,可快速推廣。據介紹,在地處大江畔的另一光伏和風電重點發展地區,八觀也交出了一份優秀的答卷,將分散式光伏功率預測月平均準確率提升了 1.4%,風電功率預測月平均準確率提升了 5.5% 。自古以來,預測天氣一直是一項充滿挑戰的任務。我們的祖先細緻地觀察自然界的種種跡象,例如雲彩的形態與色澤、風的來向與力度、動物的行為習性、植物的生長態勢等,試圖破譯天氣變化。進入現代,人們開始進行氣象學與物理學、數學、電腦科學等學科的交叉研究,任何一個單獨的學科都無法擔此重任。「八觀」氣象大模型背後的達摩院決策智慧實驗室就是這樣一支具有很強學科交叉背景的團隊,更結合了對產業的深刻理解。在過去的幾年裡,他們在時序預測等方面積累了豐富的經驗,構建了包括時序預測、時序異常檢測以及對應原子演算法的完整時序資料分析框架,近 3 年來,在 AI 頂級會議和期刊上發表 30 多篇論文。他們用 AI 預測新能源發電功率的成果,也在今年入選了聯合國 AI for Good(人工智慧向善)案例集。未來,八觀將持續向著「更懂產業的氣象預報」這一目標發力。團隊還計劃將模型的應用範圍擴充套件到民航、體育賽事、農業等多個領域,與這些領域共同迎戰風雲變幻。https://www.chinawater.com.cn/df/sd/202410/t20241010_1057216.html