氣象氣候應用在Intel最新處理器Icelake上的效能測評
浪潮 HPC實驗室
一、 Intel第三代至強可擴充套件處理器(Icelake)效能大升級
Intel於今年釋出了第三代至強可擴充套件處理器系列產品(代號Ice Lake),與上一代至強可擴充套件處理器系列產品(代號Cascade Lake)相比,第三代至強可擴充套件處理器的改變是從裡到外的,其主要升級點包括:
(1)製造工藝從 14nm 升級到了 10nm ,理論電晶體密度提升了 2.7 倍;
(2)微架構升級, IPC 大幅提升 20% ;
(3)最高核心數從之前的 28 核提升到了 40 核, AVX2/AVX512 指令集持續優化, L3 快取也從每核 1.375MB 增加到了 1.5MB ;
(4)IO 效能獲得大幅提升,記憶體從 6 通道升級到了 8 通道,改善記憶體訪問延遲。 PCIE 協議也從之前的 PCIe 3.0 升級到了 PCIe 4.0 。此外, UPI 匯流排頻寬 也有小幅的提升。
這些硬體效能的提升是否也會對應用的效能起到正面的促進作用呢?特別是針對氣象氣候這類需要大量的 CPU核做大規模平行計算才能完成任務的應用。我們知道,一般氣象氣候類應用的BF Ratio都比較高,即氣象氣候類應用的效能非常依賴於記憶體頻寬,以及浮點計算能力。因此,對於氣象氣候領域的應用而言,第三代至強可擴充套件處理器這些升級無疑是讓人充滿驚喜和期待的,尤其是其AVX指令集的優化帶來的浮點計算速度的提升和記憶體通道的增加帶來的記憶體頻寬的釋放。那麼第三代至強可擴充套件處理器對於氣象氣候應用的效能提升相對於Intel 之前的處理器到底怎麼樣呢?在此我們選取氣象氣候領域常用的幾個天氣預報和氣候預報模式,包括WRF中尺度天氣預報模式、MPAS-A跨尺度大氣模式、CESM地球系統模式進行了評測分析。
在下面的測試對比中,我們針對不同的應用,在浪潮的 HPC實驗室裡面構建了測試環境,計算節點分別使用了第二代至強可擴充套件處理器系列中的6230、6248、以及6258R等三款處理器;第三代至強可擴充套件處理器系列中的8358處理器,來做對比分析。
二、中尺度預報模式 WRF效能對比
WRF簡介
中尺度預報模式 WRF(Weather Research and Forecasting model)是由美國大氣研究中心(NCAR)、美國大氣海洋局(NOAA)和美國空間氣象局(AFWA)等共同開發的。 WRF 模式可用於數值天氣預報的研究與業務化、物理引數化方案研究、資料同化、驅動空氣質量模式、中小尺度氣候模擬以及海洋大氣模式的耦合等。
WRF測試算例
表 1給出了 WRF 算例的網格範圍和計算規模。模擬區域為兩層巢狀,空間解析度分別為 12km 和 4km,水平方向格點數分別為 425*300 和 1150*802,時間步長為 30s 和 10s,垂直方向均為 35 層。預報時間為 3h。模式每 3h 輸出一次資料。
巢狀層數 |
2 |
預報時間 |
3 h |
水平網格數 |
425*300、 1150*802 |
垂直網格數 |
35 |
水平網格解析度 |
12 km、 4 km |
積分步長 |
30 s、 10 s |
輸出頻率 |
3 h |
表 1 WRF算例的時間和網格設定
WRF效能測試結果
我們分別在 6230處理器平臺和8358處理器平臺上測試了WRF使用224核執行時的效能。WRF算例在6230處理器平臺的執行時間為695 s,在8358處理器平臺的執行時間為489 s,與6230處理器平臺相比,WRF在8358處理器平臺效能提升42%(圖1)。這主要是因為WRF為計算密集型和記憶體頻寬限制型應用,得益於第三代至強可擴充套件處理器架構的八記憶體通道設計,使記憶體頻寬得以釋放。此外浮點計算速度的增加以及低延遲的記憶體訪問,使得在8358處理器平臺上執行 WRF,效能會有很大的提升。
圖
1 6230處理器平臺和8358處理器平臺WRF效能對比
三、跨尺度預報模式 MPAS-A效能對比
MPAS-A簡介
MPASA (Model for Prediction Across ScalesAtmosphere)模式是由美國國家大氣研究中心(NCAR)主導研發的全球非靜力平衡的跨尺度預測模式。該模式採用非結構質心 Voronoi 多邊形網格和 ArakawaC 離散化方案。非結構化網格避免了結構經緯度網格中兩極的奇異點和極區網格過密的問題。另外, MPASA 可由低解析度區域較為平滑地過渡到高解析度區域,使得模擬關鍵區域有較高解析度同時還避免了邊界處物理量的突變。
MPAS-A測試算例
在我們的測試中, MPAS-A算例使用的是全球60 km解析度網格(圖2),積分步長為360 s,預報時間為2 h。
圖 2 MPAS-A非結構網格
MPAS-A效能測試結果
我們分別在 6230處理器平臺和8358處理器平臺上測試了MPAS-A使用320核執行時的效能。MPAS-A算例在6230處理器平臺執行時間為26.5 s,在8358處理器平臺執行時間為15.5 s,與6230處理器平臺相比,MPAS-A在8358處理器平臺上的效能提升了71%(圖3)。MPAS-A與WRF相似,也是記憶體頻寬限制型應用。因此8358處理器記憶體通道的增加也有助於提升MPAS-A的效能。
圖 4為MPAS-A算例在6230處理器平臺和8358處理器平臺執行時單計算節點內的實時浮點計算速度和記憶體頻寬對比。從圖中可以看出,與在6230處理器平臺相比,MPAS-A在8358處理器平臺上的浮點計算速度和記憶體頻寬都大幅提升,從而使得在8358處理器平臺上的MPAS-A效能大幅提升。另外,從BF Ratio來看,在6230處理器平臺MPAS-A的BF Ratio值約為2.55,而在8358處理器平臺MPAS-A的BF Ratio值約為2.40。這與6230處理器平臺相比BF Ratio值略有下降,其中的原因主要是與8358處理器平臺每核心L3快取增加從而降低了LLC miss率有關。
圖 3 6230處理器平臺和8358處理器平臺MPAS-A效能對比
圖 4 MPAS-A算例在6230處理器平臺和8358處理器平臺執行時單計算節點內的實時浮點計算速度和記憶體頻寬對比
四、地球氣候系統模式 CESM效能對比
CESM簡介
CESM由美國國家科學基金會和美國能源部支援開發,由國家大氣研究中心的氣候和全球動力實驗室維護的一個氣候系統模式。CESM由模擬地球大氣,海洋,陸地,陸冰、海冰、徑流和波浪7種子模組組成,中間通過一個耦合器連線,用來模擬地球的過去,現在和未來的氣候狀態。
CESM測試算例
在本次測試中, CESM所使用的算例為全耦合模式,網格是f19_g16,預報時間為1年。
|
大氣模組 |
陸地模組 |
海洋模組 |
海冰模組 |
陸冰模組 |
徑流模組 |
波浪模組 |
耦合器 |
子模組 |
cam |
clm |
pop |
cice |
sglc |
rtm |
swav |
cpl |
工作狀態 |
active |
active |
active |
active |
stub |
active |
stub |
active |
水平網格 |
1.9*2.5 |
1.9*2.5 |
gx1v6 |
gx1v6 |
null |
r05 |
null |
null |
表 2 f19_g16算例各模組狀態及解析度
CESM效能測試結果
我們選取第三代至強可擴充套件處理器 8358,並在由其構建的HPC叢集上對CESM進行了測試和優化。與第二代至強可擴充套件處理器系列相比,CESM在8358處理器平臺上有了較大的效能提升。單節點效能提升分別為94.1%(6230處理器)、82.7%(6248處理器)和64.5%(6258R處理器)。這主要是因為CESM的BF Ratio接近1,記憶體頻寬不受限制,且應用主要受限於IO和通訊的影響,故效能提升不能達到理想的線性提升,會有一定的降低,但也可以達到82.7%(6248處理器)和94.1%(6230處理器)。
圖 5 不同處理器平臺下的CESM效能對比
五、測評總結
結合 Intel 今年新發布的第三代至強可擴充套件處理器(Icelake)的記憶體通道增加,以及AVX2/AVX512指令集的進一步優化等種種令人驚喜的升級,和氣象氣候領域應用高BF Ratio的特點,我們在第三代至強可擴充套件處理器8358構建的HPC叢集上對幾種常用氣象氣候應用包括WRF、MPAS-A、以及CESM進行了測試分析,並與Intel之前的第二代至強可擴充套件處理器進行了對比。從效能來看,使用相同核數時,與在Cascadelake 6230處理器平臺相比,在Icelake 8358處理器平臺WRF效能提升42%,MPAS-A效能提升71%。這主要是因為WRF為計算密集型和記憶體頻寬限制型應用、MPAS-A為記憶體頻寬限制型應用。正是得益於Icelake的八記憶體通道設計,使得記憶體頻寬得以釋放,此外浮點計算速度的提升以及低延遲的記憶體訪問,促使在8358處理器平臺上WRF和MPAS-A的效能都獲得了大幅提升。而對於氣候模式CESM,記憶體頻寬不受限制,但同樣得益於Icelake的記憶體頻寬和浮點計算速度的大幅提升,效能更是分別提升了82.7%(6248處理器)和94.1%(6230處理器)。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31545803/viewspace-2792841/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 轉角遇上Volcano,看HPC如何應用在氣象行業行業
- 世界氣象組織:2023年全球氣候狀況報告
- 世界氣象組織:2021年全球氣候狀況報告
- 英國氣象局:全球一年期至十年期氣候最新通報
- AMD速龍200GE效能測試評測:對標Intel奔騰系列處理器Intel
- AMD速龍200GE處理器效能對比測試評測:Intel奔騰對手駕到!Intel
- 2024,氣象院排行
- 物聯網路卡在氣象局的應用
- 實現“氣候中立”,歐盟最嚴氣候政策的“囚徒”博弈
- 氣象中的常用程式碼
- 海康威視科技助力氣象智慧觀測
- 光學雨量計雨量感測器在氣象監測中的重要作用
- 國家氣象局天氣 API 引數解析API
- 雷達氣象學(7)——反射率因子圖分析(氣象回波篇)反射
- 雷達氣象學(4)——雷達引數和雷達氣象方程
- 氣象資料隨時隨地:讓天氣預報API為您的應用提供精準的天氣資訊API
- 氣候變化2022:減緩氣候變化報告(2193頁)
- ThreadRipper 2990WX評測 AMD最牛處理器開啟逆襲Intel之路threadIntel
- 用Python下載美國國家氣候資料中心(NCDC)的氣候資料Python
- AON:2021年天氣、氣候和災難報告
- i7處理器效能排行榜 i7處理器效能天梯圖最新2022
- 農業氣象綜合監測站:農業智慧化革命的強力助推器
- 世界銀行報告:應對內部氣候移民
- 高人氣低評分,二遊為何頻出兩級分化現象
- FAO報告:不公平的氣候
- 互相討厭的奧運與氣候
- 英特爾intel處理器cpu天梯圖2022年4月最新版Intel
- MakeCode圖形程式設計應用在micro:bit上的多工效能實測程式設計
- 從歷史天氣預報 API 看氣象大資料的商業價值API大資料
- LoRa氣象墒情遠端監測,助力智慧農業管理升效
- i5處理器效能排行榜 i5處理器排行天梯圖最新2022
- 全球氣象資料ERA5的下載方法
- 行業與氣象資料的相關性探索行業
- Intel 8086微處理器暫存器結構Intel
- SpringCloud 應用在 Kubernetes 上的最佳實踐 —— 高可用(容量評估)SpringGCCloud
- 世界氣象組織:2024年前10月全球平均氣溫同比升高0.16℃
- 植樹還能幫助人類應對氣候變化嗎?
- IEA:氣候適應能力促進東南亞能源安全