大快取更強勁,搭載AMD Milan-X的浪潮GPU伺服器NF5468A5的深度評測首次釋出
北京 2022年6月14日 /美通社/ -- 近日,專業媒體"架構師技術聯盟"釋出了基於浪潮GPU伺服器NF5468A5的效能測評報告。報告顯示,NF5468A5搭載2顆AMD Milan-X 7773X執行常見的氣象應用WRF和計算流體力學應用OpenFOAM作為效能基準測試,其效能相比搭載兩顆Rome 7742時的計算效能提升可高達80%。
NF5468A5是一款4U支援2顆AMD EPYC處理器和8顆雙寬GPU卡,面向AI訓練、推理、影片編解碼等多種應用場景的GPU伺服器。此次測試採用分別搭載2顆AMD Milan-X 7773X、Milan 7543和Rome 7742的配置組合。
AMD Milan-X處理器最大的亮點,就是採用3D堆疊技術(3D V-Cache),在不改變處理器面積的前提下,可用L3 快取(SRAM)總數增加三倍。做個形象的比喻,這種3D堆疊技術就像將把相同面積的平房升級成三層小樓,透過縱向空間成倍擴充套件快取數量。評測採用的NF5468A5平臺是浪潮資訊暢銷海內外的彈性雲AI伺服器NF5468系列的全新產品,率先支援PCIe 4.0技術,4U空間內可裝載2顆採用7nm先進製程工藝的AMD EPYC處理器和8塊PCIe Gen4介面的AI加速卡,能夠最大限度的發揮Milan-X處理器的極致效能。
WRF(The Weather Research and Forecasting Model),即天氣預報模式,被譽為是次世代的中尺度天氣預報模式,往往用於大範圍高分辨的氣候模擬,對系統的運算效能、記憶體的要求非常高;OpenFOAM(Open Source Field Operation and Manipulation)是對連續介質力學問題進行數值計算的軟體,經常應用於汽車模擬等行業,進行模擬計算需要處理大量的實時資料,所以對系統的計算能力、資料吞吐能力都有很高的要求。
基於浪潮NF5468A5評測報告顯示,Milan-X處理器透過搭載3D堆疊技術獲得更高的L3快取,確實對計算效能有較大提升,而效能改進意味著企業可以在更少的伺服器上執行相同的作業,消耗的功率也能有明顯降低。如下是評測報告中的效能測試資料:
在WRF測試中,使用單節點相同核心數,以Rome 7742處理器執行時間為基準,在Milan 7543上的計算效能提升14%~27%,而在Milan-X 7773X處理器上效能提升 23%~34%。
在OpenFOAM基準算例motorBike測試中,使用不可壓穩態求解器simpleFoam計算模擬摩托車和騎手周圍空氣的運動情況。同樣以Rome 7742處理器為基準,OpenFOAM在Milan 7543處理器使用單節點相同核心測試效能提升23%~28%,在Milan-X 7773X處理器上效能提升34%~80%。
在本次評測中也對NF5468A5有比較細緻的介紹,據浪潮官網顯示NF5468A5正在推出"超值機型 限免試用",對該GPU伺服器感興趣的不妨一試。如下是評測中對於浪潮NF5468A5的介紹:
NF5468A5採用分割槽散熱設計,內建獨立的CPU和GPU主機板,且分別安裝在不同的平面。從機箱內部結構來看,設計者將發熱量高的的GPU放在了機箱上3U空間,CPU板處於機箱下1U,內建6對12個6056風扇模組配合導風罩,實現機箱內風道分流,正是基於這種獨特分層散熱設計,使得送測的NF5468A5伺服器可以支援280W最高功耗的Milan-X 7773X。系統設計支援32條DDR4 ECC記憶體,支援LRDIMM/RDIMM,提供高達8T的本地記憶體,實現與1536 MB 超大L3 cache間的高速資料互動。
NF5468A5採用了CPU直連GPU架構設計,率先支援PCI-E 4.0技術,最大限度提升CPU與GPU間的頻寬,降低通訊延遲,達到最佳效能,為客戶提供極致最佳化的算力。系統提供豐富的IO擴充套件能力,提供10個PCIe 4.0 X16擴充套件槽位,支援8個全高全長的GPU加速卡。提供靈活儲存方案,可選前置12 × 3.5英寸硬碟或24 × 2.5英寸硬碟,提供超大的本地儲存能力,同時最大可支援8個熱插拔NVMe SSD全閃配置,提供儲存到記憶體到L3 cache的高速訪存,可實現十倍於高階企業級SATA SSD的IOPS效能,帶來極致IO儲存效能飛躍。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70004007/viewspace-2900582/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 小度智慧音響評測:搭載DuerOS 更懂你的心ROS
- 中科海光CPU的首次評測:基於AMD架構,覆蓋桌面伺服器端架構伺服器
- AMD的GPU現在可以加速TensorFlow深度學習了GPU深度學習
- 隨著 Zorin 15 的釋出,Zorin OS 變得更為強大
- 高效能快取伺服器 nuster 1.7.9.7 釋出快取伺服器
- 高效能快取伺服器 nuster 1.7.9.9 釋出快取伺服器
- 高效能快取伺服器 nuster 1.7.9.8 釋出快取伺服器
- 更強大的遠端開發,Remote Tunnels 正式釋出預覽版!REM
- Babylon.js 3.3釋出:更強大的粒子系統和WebVR支援JSWebVR
- 高效能 Web 快取伺服器 nuster 1.7.9.6 釋出Web快取伺服器
- 首次釋出
- 高效能快取伺服器 nuster v1.7.10.1 釋出快取伺服器
- 全球140+大模型全方位評測結果出爐,智源評測體系釋出大模型
- 瀏覽器的快取機制—強快取與協商快取瀏覽器快取
- 群暉DSM 7.1 Beta釋出:SSD快取史詩級加強快取
- 深度評測丨 GaussDB(for Redis) 大 Key 操作的影響Redis
- MapStructPlus 1.4.0 釋出,體積更輕量!效能更強!Struct
- 980克機身,搭載搭載UItra 9:全新華為MateBook X Pro釋出UI
- [Hacker News 週報] Vite 3.0 釋出;Bun 效能實測;效能更強的 Prometheus 替代方案VitePrometheus
- 華為新款旗艦P20釋出,售價5000元起,首次搭載刷臉解鎖
- 2021蘋果第二場秋季釋出會:更強大的M1 Pro晶片蘋果晶片
- AMD最強RDNA 3架構GPU釋出,小晶片設計、支援DP2.1介面,899美元起架構GPU晶片
- 英偉達釋出史上最強GPU,卻叫停了自動駕駛車路測GPU自動駕駛
- SecBench:首個網路安全大模型評測平臺釋出大模型
- 解讀JVM級別本地快取Caffeine青出於藍的要訣 —— 緣何會更強、如何去上手JVM快取
- 更難、更好、更快、更強:LLM Leaderboard v2 現已釋出
- 淺解強快取和協商快取快取
- 為高密度儲存而生 權威外媒深度評測浪潮資訊NF5266M6伺服器伺服器
- 小米9正式釋出:搭載驍龍855+20W無線快充 售價2999元起
- 高效能快取伺服器 nuster v1.8.8.2 和 v1.7.11.2 釋出快取伺服器
- 更好用 更簡單的Java快取框架 jscacheJava快取框架JS
- Cloudflare更智慧的分層快取拓撲生成Cloud快取
- http快取策略以及強快取和協商快取淺析HTTP快取
- EasyRelation釋出,簡單強大的資料關聯框架框架
- 瀏覽器強快取與協商快取瀏覽器快取
- 強制快取(200)和協商快取(304)快取
- JavaScript基礎 釋出評論/刪除評論/獲取時間JavaScript
- 聊聊發版提測和釋出評審