蘇媽殺瘋了：移動端最強NPU算力達50TOPS，最強AI晶片挑戰英偉達

机器之心發表於2024-06-04

原文網址 : https://www.jiqizhixin.com/articles/2024-06-04-6

AI晶片

你方唱罷我登場。

一年一度的 Computex 科技大會成為了 GPU 廠商們秀肌肉的舞臺，其中當屬英偉達和 AMD 最為亮眼。英偉達現場拿出了量產版 Blackwell 晶片，還公佈了未來三年的產品路線，包括下一代 Rubin AI 平臺。

AMD 當然也不甘示弱，CEO 蘇姿豐亮出了旗下的 CPU、GPU 產品及路線圖，包括全新 Zen 5 架構的桌面端 Ryzen 9000系列 CPU、AI PC 晶片、資料中心晶片和 GPU。

^蘇姿豐

全新 Zen 5 架構

銳龍 9000 桌面系列晶片首次亮相

蘇姿豐在演講中著重介紹了基於 Zen 5 架構的全新桌面端 Ryzen CPU，它們經過最佳化可以透過神經網路處理器來加速 AI 工作負載。

下圖為下一代高效能 CPU 核心 Zen 5 的各項規格，它不僅是當前 Ryzen 9000 系列處理器的核心，也將成為今年下半年推出的 Turin Epyc 霄龍伺服器 CPU 的核心。

蘇姿豐表示，Zen 5 是 AMD 迄今設計的效能和能效均最高的核心，而且它是從頭開始設計的。其中，該核心擁有一個新的並行雙管道前端，旨在提高分支預測準確性並減少延遲，並能夠在每個時鐘週期提供更高的效能。

此外，Zen 5 具有更寬的 CPU 引擎指令視窗，可以並行執行更多指令，以實現領先的計算吞吐量和效率。與 Zen 4 相比，Zen 5 的指令頻寬增加了一倍，快取和浮點單元之間的資料頻寬增加了一倍，AI 效能增加了一倍，同時具有完整的 AVX 512 吞吐量。

蘇姿豐現場首次展示了採用 Zen 5 架構的 Ryzen 9 9950X。

Ryzen 9 9950X 擁有 16 個核心和 32 個執行緒，加速後執行速度可以高達 5.67 GHz。Zen 5 的平均每個核心指令比之前的 Ryzen 晶片以及「Genoa」Epyc 9000 系列處理器中使用的 Zen 4 核心多 16%。此外，TDP 為 170W，L2+L3 快取為 80MB。

下圖為 Ryzen 9000 全系列 CPU，包括了 Ryzen 9 9950X、Ryzen 9 9900X、Ryzen 7 9700X、Ryzen 5 9600X 以及規格比較。這些產品預計今年 7 月上市。

AMD 給出的內部遊戲測試資料顯示，Ryzen 9 9950X 對遊戲效能的提升幅度不一。比如在《無主之地 3》中的表現僅比英特爾 Core i9-14900K 高出 4%，在《殺手 3》中高出 6%，在《賽博朋克 2077》中高出 13%。此外，Ryzen 9 9950X 在《F1 2023》中的表現較英特爾提升了 16%，在《DOTA 2》中提升了 17%，在《地平線零之曙光》中提升了 23%。

50TOPS

AMD 最強移動端 NPU 算力

蘇姿豐展示了下一代 AI PC 晶片 —— 銳龍 AI 300 系列 APU（第三代）。

下圖為銳龍 AI 300系列晶片實拍。

銳龍 AI 300 系列晶片旨在提供下一代 AI PC 體驗，因而要求 NPU、CPU 和 GPU 均要達到最佳。

銳龍 AI 300 系列首發提供了兩款型號，銳龍 AI 9 HX 370 和銳龍 AI 9 365。下圖為銳龍 AI 9 HX 370 的引數規格。

銳龍 AI 300 系列採用了 XDNA AI NPU，號稱移動端最強 NPU，算力達 50TOPS，不僅達到了微軟對新一代 AI PC「NPU 算力 40TOPS 以上」的標準，還超過了高通驍龍 X Elite 的 45TOPS、英特爾 Lunar Lake 的 40-45TOPS。

AMD 表示，搭載銳龍 AI 300 系列的筆記本將於今年 7 月起陸續上市。

最高 192 核心 384 執行緒

第五代 EPYC 霄龍問鼎資料中心晶片

蘇姿豐現場也展示了第五代「Turin」EPYC 霄龍晶片，它號稱全球最強資料中心 CPU。

下圖為第五代 AMD 霄龍 Turin 晶片的引數規格。目前沒有透露太多細節，從基礎資訊引數來看，Turin 具有 192 個 Zen 5 核心和 384 個執行緒，採用與 Genoa Epyc 9004s 相同的 SP5 插槽適配。

Turin 晶片可能會被命名為「Epyc 9005s」。可以期待的是，在 IPC 方面，它與 Ryzen Zen 5 晶片相近。相較於 Zen 4 核心，IPC 改進可能在 15% 到 20% 之間。蘇姿豐展示了 Turin 晶片的一些早期基準測試資料。

如下圖所示，圖上為具有 128 個核心的 Turin 晶片在 NAMD 分子動力學應用程式中執行 STMV 基準測試的效能。Turin 晶片模擬了 2000 萬個原子，並計算了計算引擎在 24 小時內可以處理多少納秒的分子相互作用。可以看到，128 核心的 Turin 晶片是 64 核心英特爾「Emerald Rapids」Xeon SP-8592 + 工作量的約 3.1 倍。

圖下為基於 Meta Llama 2 7B 模型的 AI 吞吐量基準測試，該模型以 INT4 資料格式處理，推理 token 生成設定為 50 毫秒。128 核心的 Turin 晶片是英特爾競品 CPU 效能的 2.5 倍到 5.4 倍之間，具體數值取決於工作負載。

對標英偉達

AMD 的 Instinct GPU 也一年一更

講完了 CPU，接下來的重頭戲就是 Instinct GPU 了，它將是 AMD 未來產品戰略的一個重要抓手。

蘇姿豐表示，「Antares」MI300 系列是 AMD 歷史上增長最快的產品，在 HPC 和 AI 工作負載方面的可用性看起來有點像英偉達 GPU，不過其所提供的效能優勢以及 HBM 記憶體容量、頻寬優勢較為突出。

比如在推理工作負載方面，透過對 Llama 3（具有 700 億引數）進行推理檢驗效能的結果來看，一臺配備 8 個 MI300X GPU 的伺服器效能約為一臺配備 8 個 H100 GPU 加速器的英偉達 HGX 效能的 1.3 倍。而在 Mistral 7B 模型上，單個 MI300X 的效能則是英偉達 H100 GPU 的約 1.2 倍。

隨後，蘇姿豐公佈了 2024-2026 年的 Instinct GPU 路線圖，今年推出 MI325X，2025 年推出 MI350，2026 年推出 MI400。

MI325X 將具有更大的算力規模，並轉向 HBM3E 記憶體。下圖為 MI325X 的基礎效能規格，記憶體增加了 2 倍，最高可達 288GB；頻寬增加了 30%，達到了 6TB / 秒。

下圖為 MI325X 的資料傳輸速度與英偉達 H200（141GB 記憶體）比較的結果。值得一提的是，1 萬億引數的模型將適配一臺配有八個 MI325X 的系統主機板，每個 GPU 都有 288GB 的 HBM3E 記憶體容量。

據悉，MI325X 最快將在今年第四季度推出。不過到那時，英偉達將在該領域中憑藉 B100 佔據一席之地，並將大規模量產 H200。因此，AMD 感受到了危機，並且迅速行動。

這也是為什麼 AMD 提前推出 MI350X 的原因，它採用了全新 CDNA 4 架構、臺積電 3 奈米工藝、288 GB 的 HBM3E 記憶體以及 FP6、FP4 資料型別。MI350X 也將成為 AMD Instinct MI350 系列的第一款產品。

在推理效能方面，CDNA 4 架構是 CDNA 3 的 35 倍。

MI350 的記憶體容量將是英偉達 2025 年推出的 B200（Blackwell Ultra 架構）晶片的 1.5 倍，AI 計算能力是後者的 1.2 倍。

AMD 這波就是奔著英偉達去的，到時候有好戲看了。

^{原文連結：}

^{https://www.nextplatform.com/2024/06/03/amd-previews-turin-epyc-cpus-expands-instinct-gpu-roadmap/}

^{參考連結：}

^{https://www.anandtech.com/show/21415/amd-unveils-ryzen-9000-cpus-for-desktop-zen-5-takes-center-stage-at-computex-2024}

AMD釋出最強AI晶片，對標英偉達Blackwell，2025年上市
2024-10-11
AI晶片
AI晶片混戰，誰能挑戰英偉達？
2019-01-28
AI晶片
1.2萬億電晶體，史上最強AI晶片誕生：英偉達Titan V的57倍
2019-08-22
AI晶片
英偉達與AI晶片的未來之戰
2021-06-22
AI晶片
AI晶片最強科普
2018-12-24
AI晶片
英偉達開源最強通用模型Nemotron-4 340B
2024-06-16
模型
英偉達的AI晶片霸主之路！
2019-11-25
AI晶片
英偉達釋出史上最強GPU，卻叫停了自動駕駛車路測
2018-03-28
GPU自動駕駛
特斯拉自研AI晶片，要和英偉達說再見?
2018-08-03
AI晶片
AI新利器，英偉達推出新一代超強GPU
2018-08-15
AIGPU
向英偉達發起挑戰的Groq是什麼來頭？簡單科普新型AI晶片LPU
2024-03-06
AI晶片
谷歌開放TPU應對英偉達GPU挑戰
2018-03-23
谷歌GPU
手機AI晶片大盤點，誰最強？
2019-03-05
AI晶片
獨家 | 寒武紀二代晶片釋出在即，提前解密如何挑戰英偉達！
2019-05-06
晶片解密
超算“猛將”英偉達
2020-11-19
英偉達 GTC 大會不僅有 AI 晶片，還有 AI for Science
2024-03-19
AI晶片
英偉達正在用世界上最強大的人工智慧超級計算機制作宇宙的三維地圖
2021-06-04
人工智慧計算機地圖
阿里巴巴釋出全球最強AI晶片，芯雲戰略終成型！
2019-09-25
阿里AI晶片
華為AI晶片真能幹掉英偉達，顛覆現有格局？
2018-10-13
AI晶片
聯想與高通推出微軟Copilot+PC，配備最強AI NPU
2024-05-21
微軟AI
英偉達加強與中國汽車廠商的合作
2023-03-31
最強AI算力哪裡來？三個時代的阿里疊影
2019-09-26
AI阿里
英偉達AI：修圖軟體千千萬，效果最牛的還是我這款
2019-03-01
AI
最強比特幣勒索病毒襲擊中國，360安全大腦強力秒殺
2019-03-20
比特幣
平頭哥釋出最強AI晶片含光800 打破AI晶片效能記錄
2019-09-25
AI晶片
突發！英偉達（NVIDIA）出手絕殺！不允許其他晶片模擬跑CUDA 軟體
2024-10-29
晶片
大模型步入「推理Scaling」時代，SambaNova如何挑戰英偉達的霸主地位？
2024-10-18
大模型Samba
新火種AI|美光、英偉達大漲，AI引爆後，晶片行業寒冬已過？
2023-12-21
AI晶片行業
英偉達最新AI超級算力Blackwell GPU平臺即將登陸亞馬遜雲科技
2024-03-19
AIGPU亞馬遜
英偉達RTX 5090評測解禁，天賦都點在了 AI 上
2025-01-25
AI
這是一款走心的最新測評：英偉達史上最便宜AI硬體抗造不？
2019-03-19
AI
英偉達副總裁：生物醫療將是與 AI 結合最緊密的行業之一
2019-01-21
AI行業
十年磨一劍：英偉達最「閃」GPU 登場，揭曉新一代晶片架構圖靈
2018-08-14
GPU晶片架構圖靈
阿里最強 Python 自動化工具開源了！
2021-04-01
阿里Python
英偉達在CES上推出AI處理平臺
2018-03-06
AI
英偉達GPU顯示卡計算能力評估
2020-04-06
GPU
阿里巴巴釋出第一顆自研晶片，全球最強 AI 晶片含光 800
2019-09-25
阿里晶片AI
極氪成為英偉達「全能晶片」首客夏皮羅：盡力擺脫禁令約束
2022-09-21
晶片

蘇媽殺瘋了：移動端最強NPU算力達50TOPS，最強AI晶片挑戰英偉達

相關文章