北京2022年4月7日 /美通社/ -- 2022年4月7日，全球權威AI基準評測MLPerf™公佈最新AI推理（Inference）V2.0榜單，浪潮AI伺服器以最高效能獲得了資料中心（固定任務）的全部16項冠軍。

MLPerf™由圖靈獎得主大衛·帕特森（David Patterson）聯合頂尖學術機構發起成立，是國際最權威的AI效能基準評測，每年組織AI推理和AI訓練測試各兩次，以對迅速增長的AI計算需求與效能進行及時的跟蹤測評。MLPerf™比賽通常分為固定任務（Closed）和開放優化（Open）兩類任務，開放優化能力著重考察參測廠商的AI技術創新力，固定任務則因更公平地考察參測廠商的硬體系統和軟體優化的能力，成為更具參考價值的AI效能基準測試。

本次是2022年MLPerf™的首次AI推理效能評測，旨在考察在各類AI任務中，不同廠商計算系統的推理速度和能力。本次評測中，在競爭最激烈的資料中心（固定任務）賽道，共有926項成績提交，數量較上次比試翻倍，競爭非常激烈。

浪潮 AI伺服器創推理效能新紀錄

本次MLPerf™AI推理效能評測涵蓋使用廣泛的六大AI場景，包括影像分類、自然語言理解、語音識別、目標物體檢測、醫學影像分割、智慧推薦，每個場景採用最主流的AI模型作為測試任務，分別為ResNet50、BERT、RNNT、SSD-ResNet34、3D-Unet、DLRM。MLPerf™測試要求模型推理精度達到99%以上，對於自然語言理解、醫學影像分割和智慧推薦3個任務則設定99%與99.9%兩種精度要求，以考察當提升AI推理精度要求時對計算效能的影響。

為更加貼近實際應用情況，MLPerf™推理測試在資料中心賽道下設定了離線（Offline）與線上（Server）兩種模式。離線模式代表任務所需所有資料都在本地可用，典型場景如大批量醫療影像樣本存於本地等待統一識別。線上模式則反映了大部分的即時AI應用，其資料和請求以突發和間歇的方式線上送達，例如使用者在瀏覽購物網站時智慧推薦的推理請求。

浪潮AI伺服器此次表現出色，以最高效能包攬了此次MLPerf™資料中心（固定任務）賽道的全部16項冠軍。

本次MLPerf™測試中，浪潮AI伺服器在ResNet50模型任務中創造了每秒處理449,856張圖片的效能紀錄，相當於僅用2.8秒即完成ImageNet資料集128萬張圖片的分類；在3D-UNet模型任務中，創造了每秒處理36.25張醫療影像的新紀錄，相當於在6秒內完成對KiTS19資料集207張3D醫療影像的分割；在SSD-ResNet34模型任務中，創造了每秒對11,081.9張圖片完成目標物體識別及定位的新紀錄；在BERT模型任務中，創造了平均每秒完成38,776.7個問答的效能紀錄，在RNNT模型任務中，創造了每秒將155,811段語音轉為文字的效能紀錄，在DLRM模型任務中，則創造每秒實現2,645,980次點選預測的最佳效能紀錄。

此外，本次MLPerf™評測還設有邊緣推理賽道，浪潮面向邊緣場景設計的AI伺服器同樣表現出色，在邊緣固定任務賽道的全部17項任務中斬獲了11項冠軍。

隨著AI應用在各個行業中的持續深化，更快的推理速度，將帶來更高的AI應用效率與能力,加速產業智慧化轉型。相比半年前的MLPerf™AI推理榜單V1.1，浪潮AI伺服器將影像分類、語音識別和自然語言理解任務的推理效能分別提升31.5%、28.5%及21.3%，意味著浪潮AI伺服器在自動駕駛、語音會議、智慧問答和智慧醫療等等場景中，能夠更高效快速地完成各類智慧任務。

全棧優化能力助推 AI效能持續提升

浪潮AI伺服器在MLPerf™基準評測中的出色表現，得益於浪潮資訊卓越的AI系統設計能力和全棧優化能力。

本次參與測評的浪潮AI伺服器NF5468M6J擁有出色的系統設計，以分層可擴充套件計算架構在業界率先實現對12顆NVIDIA A100 Tensor Core GPU的支援，並以極佳的效能成績一舉攬獲12項冠軍。浪潮資訊也是本次MLPerf™競賽中可以唯一提供伺服器支援8顆500W NVIDIA A100 GPU的廠商，並實現了風冷及液冷兩種散熱方式。在此次參賽的8顆GPU NVLink高階主流機型中，浪潮AI伺服器在資料中心16個任務中斬獲14項最佳成績，展現出在高階機型中的領先優勢。其中，NF5488A5是全球首批上市的A100伺服器，在4U空間支援8顆第三代NVlink互聯的NVIDIA A100 GPU和2顆AMD Milan CPU。NF5688M6是面向大規模資料中心優化設計的具備極致擴充套件能力的AI伺服器，支援8顆A100 GPU和2顆Intel Icelake CPU，支援多達13張PCIe Gen4的IO擴充套件卡。

在硬體層面，浪潮AI伺服器通過對CPU、GPU硬體效能的精細校準和全面優化，使CPU效能、GPU效能、CPU與GPU之間的資料通路均處於對AI推理最優狀態；在軟體層面，結合GPU硬體拓撲對多GPU的輪詢排程優化使單卡至多卡效能達到了近似線性擴充套件；在深度學習演算法層面，結合GPU Tensor Core 單元的計算特徵，通過自研通道壓縮演算法成功實現了模型的極致效能優化。

浪潮資訊是全球領先的AI計算廠商，AI伺服器市場份額全球第一，連續五年以超50%的市場份額穩居中國AI伺服器市場第一。浪潮資訊致力於AI計算平臺、資源平臺和演算法平臺的研發創新，並通過元腦生態攜手領先夥伴加速數實相融。

MLPerf最新發榜，浪潮AI伺服器囊括資料中心推理全部冠軍

相關文章