在第 20 屆 CCF 全國高效能運算學術年會 (CCF HPC China 2024)——數值模擬工程應用中的智慧超算融合技術論壇上,來自中國科學院計算機網路資訊中心人工智慧部工程師萬萌分享了團隊在光伏發電、電力負荷中積累的實際應用及方法方案,以及深度學習在時間序列預測領域的前沿研究動態,為新能源預測提供新的技術思路和方法。
HyperAI超神經在不違原意的前提下,對本次深度分享進行了整理彙總,共分為時間序列、新能源背景概況、研究基礎、研究進展 4 個部分。以下為演講實錄。
時間序列應用廣泛,涵蓋多個方面
我們所研究的時間序列旨在對特定物件的未來發展趨勢或狀態,進行科學的預測和判斷。在我們的現實生活中,時間序列的應用廣泛,涵蓋了交通流量、金融經濟、氣象天氣、病毒傳播以及能源等多個方面。
當前時間序列的研究方向主要分為 4 個部分。第 1 部分是時序未來預測,可以根據我們已知的歷史序列來預測未來的序列,包括光伏預測、氣象預測、股票預測等。第 2 部分是時序空值填補,包括輿情監測、感測器故障、工業裝置維護等,如工業場景下的感測器故障導致部分執行資料缺失。第 3 部分是時間序列的異常檢測(時序異常流量),這也是網路流量方面十分常見的現象,如網路異常攻擊、異常環境監測、金融欺詐識別等。第 4 部分是時間序列的分類,例如醫學中的心電圖分類,語音分類以及地震監測等。
接下來,我們將探討時間序列與傳統語言序列之間的顯著差異。人類語言序列通常由句子組成,是離散的表示形式,具有高語義密度。相比之下,時間序列大多由自然訊號組成,可能包含連續的數值點,其主要特徵是語義密度相對較低。
午間消納困難與晚峰電力供應緊張矛盾凸顯,新能源預測面臨 3 大挑戰
在探討如何解決這一問題時,我將重點介紹我們團隊在時間序列新能源方向的的研究進展,具體內容為光伏發電出力的預測。
由於光伏發電具有午間發電量大、晚間幾乎無出力的特性,增加了整個電力系統的調節難度。特別是在午後,新能源的消納變得較為困難,同時晚峰時段的電力供應也面臨緊張,這種矛盾尤為突出。因此,對於日前發電計劃的制定、日內電力平衡的調整以及電力市場的執行,對光伏發電預測的準確性需求空前強烈。
光伏發電當前背景概況
然而目前對於新能源預測面臨 3 大重要挑戰。首先是是數值天氣預報目前不滿足高精度光伏電站的預測需求;其次是集中式光伏電站模型不足以描述功率波動,難以適應多時刻多氣象條件下預測需要;第三是分散式光伏電站缺乏地面輻照度資料,時空特徵分佈不足,無法滿足多時間尺度預測。
構建集中式光伏電站與分散式光伏多時間尺度功率預測模型
面對一系列挑戰,我們提出了多項模型研究方案,旨在構建集中式光伏電站與分散式光伏多時間尺度功率預測模型。我們首先收集了多源氣象資料,涵蓋不同時間尺度和氣象型別的資料,包括衛星雲圖、數值天氣預報資料、地面測量資料以及光伏電站的測量資料。
其次,基於這些資料,我們在上一層構建了輻照度預測模型,用於指導集中式和分散式光伏電站的超短期預測。在此基礎上,我們進一步構建了超短期、中期、短期及其他時間尺度的預測模型。最後,我們搭建了一個全時間尺度的預測平臺。
總體研究思路架構圖
多源氣象資料
首先,針對光伏電站的地表太陽輻照度超短期預測模型,當前的主要問題在於數值天氣預報通常每 12 小時更新一次,且其空間解析度和精度較低,難以滿足光伏電站預測空間和時間解析度需求。
為解決這一問題,我們結合了葵花 8 號 (Himawari-8) 衛星雲圖和數值天氣預報資料。葵花 8 號的雲圖具有 4km4km 的空間解析度和 10 分鐘的時間解析度,但存在 20 分鐘的延遲。而數值天氣預報的時間解析度為 15 分鐘,空間解析度為 9km9km,更新頻率為每 12 小時一次。
光伏電站的地表太陽輻照度超短期預測模型技術路線
輻射度預測模型
面對這些差異,我們開發了超短期預測模型,採用多種插值方法對多源氣象資料進行平行對齊,解決了資料延遲的問題。透過基於 Res-UNet 和雙線性插值的地表短波輻照度預測方法,我們在多種氣象條件下預測的 MAE 和 RMSE 分別平均降低了 31.31% 和 22.18%。右下圖展示了河北涉縣東皇中電投站點的實際案例,結果表明,Res-UNet 相較於 NWP 和 UNet 更能準確預測輻照度的抖動性和峰值。
光伏電站的地表太陽輻照度超短期預測模型架構及案例
光伏功率預測模型
對於集中式光伏電站的超短期預測模型,其問題主要體現在對數值天氣預報的嚴重依賴和精度不足。針對這一問題,我們提出了基於雙編碼變換器的集中式光伏超短期功率預測方法,結合地面觀測資料與衛星雲圖中的雲層變化特徵資料,打破了光伏預測單純依賴數值天氣預報資料的侷限性。
UNet 雲圖特徵提取骨幹網路與多源資料融合雙編碼變換器
在集中式光伏電站短期功率預測方面,單一模型的預測誤差較大,易受突發天氣的影響。為此,我們提出了基於分時-長短期記憶網路的集中式光伏短期功率預測方法,綜合運用輻照度、環境溫度、溼度等歷史氣象資料與光伏發電功率的時間相關性特徵,解決了單一預測模型難以適應複雜多變氣象條件問題,有效提升了複雜氣象條件下的預測精度。
集中式光伏電站短期預測模型技術路線
針對中長期預測,主要挑戰是如何捕捉光伏發電的季節性、週期性和長期趨勢變化。為解決這一問題,我們提出了基於雙重注意力編碼器的集中式光伏中期功率預測方法,綜合運用週期性、季節性和趨勢性氣象特徵資料,實現了對不同季節、連續多時間特徵的精準捕捉,率先實現了時間序列週期和趨勢自動提取。相關成果已發表在 AAAI 會議上。
論文地址:
https://ojs.aaai.org/index.php/AAAI/article/view/25845
基於互動式並行注意力和進化季節性、趨勢分解的中期功率預測方法
對於分散式光伏電站的全時間尺度預測模型,主要問題在於其規模小、分佈廣,缺乏精確的現場氣象觀測資料。當前的預測模型未充分考慮多源資料的時空融合,導致精度不足。為此,我們分別提出了針對超短期、短期和中期的分散式光伏電站功率預測模型。
我們還提出了多層圖注意力機制,批次自動提取海量分散式光伏與周邊集中式光伏電站實測氣象資料、衛星雲圖的時空相關性;提出了基於雙重注意力網路的分散式光伏短期功率預測模型,透過站內和站間注意力機制,融合分散式電站的數值天氣預報資料和集中式光伏電站的地面量測資料,實現預測模型在地理空間特徵融合;提出了基於地理感知多層注意力機制的分散式光伏中期功率預測方法,透過灰色關聯分析篩選強相關集中式光伏電站,採用站間-站內多層次細粒度注意力機制,自動提取集中式光伏電站氣象特徵與分散式光伏電站功率的時空相關性。
分散式光伏電站全時間尺度預測模型技術路線
綜合性平臺
最終,我們開發了一套全電壓等級多時間尺度省級輻照度資源與光伏發電監視、預測和調控系統平臺,包括光伏資源及執行資料監測功能模組、集中式光伏全時間尺度預測功能模組、分散式光伏全時間尺度預測功能模組以及光伏一體化控制功能模組。
- 光伏資源及執行資料監測功能模組:實現了氣象資料實測及展示,集中式光伏電站與海量低壓分散式光伏全景監視。
- 集中式光伏全時間尺度預測功能模組:實現了光伏全時間尺度的實時監測、異常預警、模型自學習等。
- 分散式光伏全時間尺度預測功能模組:實現了 NWP 資料管理,光伏站實測資料、基礎資料管理,區域功率預測,光伏站功率預測,系統管理等功能。
- 光伏一體化控制功能模組:實現了全面資料監測與協同最佳化排程,集中式與分散式預測相結合,自動調節與最佳化,異常檢測與警報,保障電網安全穩定執行和新能源高水平消納。
全電壓等級多時間尺度省級輻照度資源與光伏發電監視、預測和調控系統平臺
時間序列在非新能源領域取得的兩大工作進展
接下來,我將主要介紹時間序列在非新能源領域取得的工作進展。一方面,我們提出了基於語義增強和多流管道的通用無失真壓縮框架,主要包括位元組流語義增強、多流管道加速、視訊記憶體最佳化 3 個研究內容。
在位元組流語義增強方面,我們開發了一系列新的方法來獲取複雜的語義資訊,其中包括 Patch 維度融合和自適應滑動視窗等技術。
在多流管道加速方面,我們研發了針對 GPU 多複製引擎的多流加速模組和麵向 CPU 多核的佇列模型。
位元組流語義增強和多流管道框架
在視訊記憶體最佳化方面,我們首次提出了多流場景下視訊記憶體最佳化策略。具體而言,我們首先使用分析器分析記憶體分配和釋放的順序,以識別可以共享的記憶體塊。我們關注的是那些很少但佔用大部分記憶體的記憶體塊,以最大限度地提高記憶體重用率。
基於此,我們設計一個共享池策略來管理流之間的共享記憶體塊,它使用的大型連續記憶體塊被釋放回共享池並標記為保留塊;下一個阻塞流可以透過將其指標調整到這些塊的地址來訪問這些保留塊。當 S2 請求新的記憶體空間時,它會在共享池中搜尋可用的保留塊。如果找到合適的塊,malloc 會在下一個流中重用它們,從而顯著節省記憶體。
視訊記憶體最佳化框架
我們取得的主要成果有:對深度學習的壓縮器,在影像、文字、音訊、影片、異構混合資料上,平均有 3% 以上的壓縮率和 35% 以上的壓縮速度增強,與 PAC 壓縮器結合達到目前的 SOTA;語義增強方法可以擴充到時間序列等任務中,進一步提升時序預測的精度;多流管道加速可以擴充到有失真壓縮等領域,提升整體壓縮速度。
壓縮結果
另一方面,我們提出了面向通用時間序列的多尺度模型 CSIformer。首先,我們設計了自適應 Patch 劃分網路,透過學習中心點和左右邊界,實現對傳統超參的自動適配。此外,我們還提出了自適應 Stride 策略,利用掩碼矩陣實現對不同語義密度塊的步長調整。最後,為了增強對長序列資訊的捕獲和感知,我們還設計了金字塔融合策略,從而提升了模型在長序列中的表現。
多尺度模型 CSIformer
在光伏預測的多級序列分解模型方面,我們重點研究了小波分解單元 (WTDU)、季節趨勢分解單元 (STDU) 以及 SEEDTrans 架構。值得注意的是,該模型在中國河北的 6 個發電站中,預測精度相比傳統 ARIMA 模型提高了 40% 以上。
關於萬萌
萬萌,北京科技大學在讀博士,現任中國科學院計算機網路資訊中心人工智慧部工程師,於北京郵電大學和英國南安普頓大學分別獲得軟體工程學士和碩士學位。
他主要從事時間序列預測、人工智慧平臺等相關研究,包括光伏發電處理預測、高分子材料計算與模擬、生態碳迴圈等。先後參與了「中國科技雲軟體資源池建設」、「人工智慧創新應用」等專案課題。