正如黃仁勳所說的,今天的釋出會有關於:「Amazing science, amazing graphics, amazing products and amazing AI.」
核心內容:
新一代伺服器級 GPU:搭載英偉達 RTX 技術的 GPU Quadro GV100,以及「世界最大的 GPU」
NVIDIA AI 平臺:TensorRT 4 等技術,多種重大改進
推出 DRIVE Constellation 自動駕駛模擬系統
圖注:黃仁勳 Keynote 演講總結
搭載英偉達 RTX 技術的 GPU Quadro GV100
在今天的 GTC 大會 Keynote 中,黃仁勳首先宣佈推出搭載 NVIDIA RTX 技術的 Quadro GV100 GPU,首次向數以百萬計的藝術家和設計師提供實時光線追蹤技術。
黃仁勳表示,結合強大的 Quadro GV100 GPU,NVIDIA RTX 能夠在執行專業設計及內容創作類應用程式的同時,實現實時的計算密集型光線追蹤。
Quadro GV100 具有 32GB 記憶體,且可藉助 NVIDIA NVLink 2 互聯技術,透過並聯兩塊 Quadro GPU 擴充套件至 64GB,在所有適用於此類應用的平臺中其效能最高。
在效能方面,GV100 基於 NVIDIA Volta GPU 架構,可提供每秒 7.4 萬億次浮點運算的雙精度效能、每秒 14.8 萬億次浮點運算的單精度效能、以及每秒 118.5 萬億次浮點運算的深度學習效能。NVIDIA RTX 內建的 NVIDIA OptiX AI-denoiser 可實現實時的 AI 去噪,英偉達表示且其效能相當於採用 CPU 時的 100 倍。
NVIDIA AI 平臺:多項重大改進
而後,如同往屆,黃仁勳對英偉達 AI 平臺做了介紹,公佈了其中的一系列重要進展,包括全新 Tesla V100 32GB GPU 的 2 倍記憶體、革命性的 NVSwitch 結構、以及全面的軟體堆疊推動效能提升、深度學習工作站 DGX-2 成為首款效能高達每秒 2 千萬億次浮點運算的深度學習系統、釋出深度學習引擎 TensorRT 4 等。英偉達表示,相較於六個月前釋出的上一代產品 DGX-1,其深度學習工作負載效能實現了 10 倍提升。
在大會上,黃仁勳宣佈,新版的 Tesla V100 記憶體擴容了一倍。「5 年前 AlexNet 在 ImageNet 上展示了突破性的能力,」黃仁勳說道,「它有 8 層,數百個引數。而今天我們能夠看到數百層的神經網路,內含數十億引數,深度學習模型經過五年的發展,體量擴大了 500 倍。」
而這樣的計算需求可由「世界上最大的 GPU」DGX-2 進行處理,它是由 16 塊 32GB 記憶體的 Tesla V100 計算卡透過 NVSwitch 進行連線(顯示卡間的通訊速度是 PCI 的 20 倍,每秒 300Gbyte)所組成的,共擁有 2000TFPLOS 的 Tensor Core 算力,售價 39.9 萬美元。NVSwitch 是今天黃仁勳宣佈的全新的 GPU 互聯結構。
DGX-2 是首款能夠提供每秒兩千萬億次浮點運算能力的單點伺服器,具有 300 臺伺服器的深度學習處理能力,佔用 15 個資料中心機架空間,而體積則縮小 60 倍,能效提升 18 倍。
而後,黃仁勳宣佈了英偉達在 AI 推理上的一系列動作。黃仁勳表示,基於在資料中心、汽車應 用、以及包括機器人和無人機等嵌入式裝置領域中,諸如語音識別、自然語言處理、推薦系統、 以及影像識別等新功能的支援,面向深度學習推理的 GPU 加速正在獲得越來越多的關注。
「我們需要超級計算機來幫助自己尋找更高效的能源儲存方法,探索地球的內部,預測未來的自然災害,以及模擬微觀世界的變化。」黃仁勳說道。
英偉達宣佈推出新版 TensorRT 推理軟體 TensorRT 4,並將 TensorRT 整合至谷歌的 TensorFlow 框架。
英偉達表示,TensorRT 4 可用於快速最佳化、驗證及部署在超大規模資料中心、嵌入式與汽車 GPU 平臺中經過 訓練的神經網路。相比 CPU,針對計算機視覺、神經網路機器翻譯、自動語音識別、語音合成 與推薦系統等常見應用,該軟體最高可將深度學習推理的速度加快 190 倍。而且為了進一步精簡開發,英偉達與谷歌的工程師已將 TensorRT 整合至 TensorFlow 1.7,使得在 GPU 上執行深度學習推理應用更加容易。
此外,英偉達還宣佈了面向 Kubernetes 的 GPU 加速,以促進企業在多雲 GPU 叢集上的推理部署。英偉達將針對開源社群強化 GPU 效能,以支援 Kubernetes 生態系統。
推出 DRIVE Constellation 模擬系統
自動駕駛一直是 GTC 大會的重要部分,今天,英偉達展示了一套用於使用照片級真實感模擬,基於雲的自動駕駛汽車測試系統。
該系統被稱為 NVIDIA DRIVE Constellation,是一種基於兩種不同伺服器的計算平臺。第一臺伺服器執行 NVIDIA DRIVE Sim 軟體,用以模擬自動駕駛汽車的感測器,如攝像頭、鐳射雷達和雷達。第二臺伺服器搭載了 NVIDIA DRIVE Pegasus AI 汽車計算平臺,可執行完整的自動駕駛汽車軟體堆疊,並能夠處理模擬資料,這些模擬資料如同來自路面行駛汽車上的感測器。
要實現自動駕駛汽車的量產部署,我們需要一種能夠在數十億英里的行駛中進行測試和驗證的解決方案,以實現足夠安全性和可靠性。黃仁勳介紹說,DRIVE Constellation 可以將視覺計算和資料中心方面的專業知識相結合以實現這一目標。藉助虛擬現實技術,測試者可透過對數十億英里的自定義場景和極端情況進行測試,從而提高演算法的穩定性,而花費的時間和成本僅為實際道路測試的一小部分。
此外,英偉達還推出了機器人開發平臺 ISSAC 等工具。同時宣佈與 ARM 展開合作。兩家公司正在合作將開源的 NVIDIA 深度學習加速器 NVDLA 架構整合到 Arm 的 Project Trillium 平臺上,以實現機器學習。此次合作將使物聯網晶片公司能夠輕鬆地將 AI 整合到自己的設計中,並幫助它們將智慧化且價格低廉的新產品帶給全球數十億的消費者。
小結
英偉達 GTC 大會從 2009 年開辦以來,越來越受到人們的關注。而隨著人工智慧的火熱,GPU 價值也水漲船高。而本屆 GTC 相比於第一屆,參會人數增加了近 10 倍,火熱程度也超乎以往。但遺憾的是,今天的釋出仍然圍繞商用計算裝置進行,不像國內外眾多媒體猜測的那樣會發布新一代 Geforce 顯示卡。或許,眾多玩家還要繼續等待一段時間。