全球最強GPU晶片已量產、下一代Rubin曝光,老黃繼續打破摩爾定律

机器之心發表於2024-06-03
黃仁勳:我家的 GPU 晶片一年一更新,其他家怎麼追?

昨晚,英偉達創始人、CEO 黃仁勳在 2024 年 COMPUTEX 科技大會上又為全球發燒友們、顯示卡買家們帶來了一場重磅演講。

圖片

經典皮膚(皮衣)老黃亮相。

在會上,黃仁勳分享了有關 AI 晶片及架構、加速計算、AI 理解物理世界、機器人的成果和洞見。

量產版 Blackwell 亮相
下一代 AI 平臺 Rubin 兩年後到來

今年 3 月,英偉達在其一年一度的 GTC 大會上官宣了 2080 億電晶體的 Blackwell 晶片。它是英偉達首個採用 MCM(多晶片封裝)設計的 GPU,在同一個晶片上整合了兩個 GPU。
圖片
近三個月過去了,Blackwell 晶片發展到了哪一步了?

老黃現場果然沒讓人失望,拿出了最新量產版的 Blackwell。他表示,這款當今世界上最強大的 GPU 已經投入了生產。

圖片

黃仁勳稱,短短八年時間,英偉達使得 AI 算力從 2016 年 Pascal 的 19 TFLOPS 提升到了 2024 年 Blackwell 的 20000 TFLOPS,整整提升了 1000 倍。這一速度幾乎超越了摩爾定律在最佳時期的增長。
圖片
AI 算力提升的同時,成本也在逐年下降。

黃仁勳以訓練 GPT-4(1.8 萬億引數)為例,八年時間,該模型的能耗從 2016 年的 1000+GWh 下降到了如今的 3GWh,下降了 350 倍。這裡他甚至還為 token 定了一箇中文譯名 —— 詞元。
圖片
整合了 Blackwell 晶片的最新 DGX 超算系統在各方面都實現了質的提升。

與上一代 Hopper 系統相比,Blackwell 系統的 NVLink 域整合 72 個 GPU、效能提升了 9 倍,NVLink 頻寬增加了 18 倍,AI 算力提升了 45 倍,供能提高了 10 倍。
圖片
此外,黃仁勳還公開了 Blackwell 後三代晶片路線圖,即 Blackwell Ultra(2025 年)、Rubin(2026 年)和 Rubin Ultra(2027 年)。這也是下一代 AI 平臺 Rubin 首次亮相。

黃仁勳表示,英偉達將保持一年一次的更新節奏,確保所有產品實現 100% 架構相容。不過,他並沒有透露關於 Rubin 的更多細節。
圖片
可以看到,英偉達推出全新 GPU 的速度始終跑在了其他公司的前頭。有人對此表示,由於缺少強有力的競爭對手,現在英偉達只能與摩爾定律展開競爭了。
圖片
圖源:X@Sentdex

當然,英偉達這些年的成功在其股票市值上得到了很好地體現。最近幾天的市值一度達到了 2.8 萬億美元,與市值第一的蘋果之間的差距越來越小。

遊戲助手 Project G-Assist

Project G-Assist 是一個由 RTX 驅動的 AI 助手,為 PC 遊戲和應用提供上下文感知的幫助。

一般來講,PC 遊戲擁有廣闊的世界和複雜的機制,即使是高階玩家也會感到挑戰。Project G-Assist 旨在讓玩家能夠方便地獲取遊戲和系統方面的知識。

圖片

Project G-Assist 可以接收玩家的語音或文字輸入,同時還可以獲取遊戲視窗中的快照。這些快照被輸入到 AI 視覺模型中, 從而提供上下文感知和特定於應用程式的理解。之後 LLM 輸出一個富有洞察力和個性化的響應 —— 要麼是文字,要麼是 AI 語音。
圖片
為了展示 Project G-Assist 的潛力,英偉達還和 Studio Wildcard 展開合作,上新了一系列演示:例如透過按下快捷鍵或使用喚醒短語,AI 助手可以幫助玩家解答問題。
圖片
AI 助手還能建議玩家是否應該避開遊戲中的恐龍,或者提供建議來馴服特定的野獸。

圖片

此外,Project G-Assist 在效能調優方面也非常有用。

透過一個簡單的提示,Project G-Assist 可以評估玩家的系統配置和效能,並立即調整以獲得最佳體驗。
圖片
透過一個簡單的提示,Project G-Assist 可以評估您的系統配置和效能,並立即進行調整以獲得最佳體驗。

AI 助手還能夠跟蹤並繪製幀率、功率使用、PC 延遲以及其他硬體統計資料的圖表,並在被提示時提出改善這些指標的方法。
圖片
NVIDIA NIM 徹底改變了模型部署方式

現在,全球 2800 萬開發者都可以藉助 NVIDIA NIM 輕鬆地建立生成式 AI 應用。NIM 是一種推理微服務,透過以經過最佳化的容器的形式提供模型,以部署在雲、資料中心或工作站上。

NIM 還能幫助企業實現基礎設施投資的效果最大化。例如,與未使用 NIM 的情況相比,在 NIM 中執行 Meta Llama 3-8B 所能生成的加速基礎設施 AI token 可以提升 3 倍。
圖片
Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近 200 家技術合作夥伴正將 NIM 整合到他們的平臺中,加快生成式 AI 部署到特定領域應用中的速度,例如 copilots、程式碼助手、數字人虛擬形象等。從 Meta Llama 3 開始,在 Hugging Face 上現已開始提供 NIM。

NVIDIA 機器人技術

NVIDIA 正在引領價值 50 萬億美元的工業數字化變革,其透過開發者計劃提供對 NIM 的訪問許可權,以促進 AI 創新。

黃仁勳展示了 Foxconn 如何利用 NVIDIA Omniverse、Isaac 和 Metropolis 建立數字孿生,透過結合視覺 AI 與機器人開發工具來實現增強的機器人設施。

NVIDIA Isaac 平臺為開發者構建 AI 機器人提供強大的套件,包括由 AI 模型以及 Jetson Orin、Thor 等超級計算機驅動的 AMR、工業機械臂和人形機器人。

「機器人和物理 AI 正在成為現實,而不僅是出現在科幻小說。這真的令人興奮,」黃仁勳補充道。
圖片
全球電子行業領導企業正在將 NVIDIA 自主機器人技術整合到他們的工廠中,利用 Omniverse 中的模擬功能來測試和驗證物理世界的新一代 AI。全球 500 多萬臺預程式設計機器人也在此行列中。

「機器人將遍佈所有工廠。工廠將實現對機器人的統籌,而這些機器人將製造新的機器人產品,」黃仁勳解釋道。

相關文章