英偉達釋出全球最大GPU：效能提升10倍，售價250萬

夏乙發自凹非寺
量子位出品 | 公眾號 QbitAI

640?wx_fmt=gif&wxfrom=5&wx_lazy=1

英偉達的新殺器又來了。

剛剛，在GTC 2018大會上，黃仁勳釋出全球最大GPU。

他說的是DGX-2。

DGX-2能夠實現每秒2千萬億次浮點運算（2 PFLOPS），效能比去年9月推出的DGX-1效能提高了10倍，售價39.9萬美元（人民幣250萬元）。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

這次的GTC 2018大會在美國加州聖荷西舉行，黃仁勳照例身著皮衣登臺演講。（官方還特別提示：這次是一件全新的皮衣）

而老黃這次的演講主題，是四個Amazing：amazing graphics、amazing science、amazing AI、amazing robots。

首先，從不可思議的影像開始。

在這個環節裡，黃仁勳介紹了英偉達在影像實時光線追蹤處理方面的最新進展，展示了細膩的反射效果。

640?wx_fmt=gif

這項技術，稱為RTX。它面向圖形領域，藉助深度學習技術，實現了實時光線追蹤。

640?wx_fmt=png

然後黃仁勳釋出了首款基於Volta架構的工作站GPU：Quadro GV100。

它支援英偉達RTX技術，支援NVLink 2，32GB容量HBM2視訊記憶體。兩個GV100相連，可以提供10000多個CUDA核心，236 teraflops的TensorFlow核心。

說著說著，老黃又開始講這句：買得越多，省得越多。（The more GPUs to buy, the more money you save.）

“來GTC，學習如何節省百萬美元。”老黃髮出誠懇的建議。

然後進入不可思議的科學環節。

我們正處在GPU計算的關鍵點，黃仁勳表示。這部分他還介紹TESLA V100等產品的多快好省，也談到一些GPU在計算和醫療影像方面的貢獻。

比如醫療影像超級計算機CLARA。

640?wx_fmt=png

深度學習給醫療影響的識別帶來了諸多變革，但投入到實際使用中卻很難。醫院用著十幾年前生產的超聲儀，黑白渣畫質成了醫療進步的阻礙。

要等所有醫院升級裝置，可能要花上30年。

CLARA是一款醫療影像的超級計算機，讓醫院可以升級那些已有的系統。醫生可以仍然用原有的超聲、CT等裝置，然後將影像輸入超級計算機，推理出更清晰的影像。

在這個專案上，英偉達聯合了一大群醫療行業的合作伙伴：

640?wx_fmt=png

以及在這個環節，黃仁勳又引導全場跟他念：買得越多，省得越多。

來到不可思議的AI環節。

這個環節的主題是“全球最大的GPU”。

首先，英偉達把Volta V100m每張卡的記憶體擴大到32GB。適用於記憶體密集型的深度學習和高效能運算，還能將記憶體受限的HPC應用效能提升高達50%。

其次，是全新發布的互聯結構NVSwitch，頻寬比最好的PCIe交換機高出5倍，最高支援16個Tesla V100同時以2.4TB/秒的速度進行通訊。

640?wx_fmt=gif

最後，一個全新的DGX伺服器釋出了。

黃仁勳說這個現在是全球最大的GPU了：新的DGX-2，包括20億個電晶體，12個交換機。每個GPU都可以通過光纖交換機互相通訊，比PCIe介面快20倍。

640?wx_fmt=gif

DGX-2的算力可達2千萬億次浮點運算，功耗10千瓦。這臺機器內部是NVLink連線的兩組Tesla V100陣列。

與6個月前釋出的DGX-1相比，DGX-2提速10倍。

五年前，在兩塊GTX 580上進行Alexnet訓練耗時六天，現在使用DGX-2，可以在18分鐘以內完成。

這款產品將於今年三季度發售，每臺價格39.9萬美元（人民幣250萬元）。

DGX-2具有300臺伺服器的深度學習處理能力，佔用15個資料中心機架空間，而體積則縮小60倍，能效提升18倍。

此外，英偉達還更新了CUDA、TensorRT、NCCL、cuDNN等深度學習和HPC軟體堆疊。

新版的TensorRT能快速優化、驗證和部署在超大規模的資料中心，針對更廣泛的應用加速深度學習推理。它最高可以將深度學習推理的速度加快190倍，降低70%的資料中心成本。

TensorRT 4還整合到了谷歌TensorFlow 1.7版本中，更易於使用。

另外，NVIDIA還宣佈和ARM合作，將英偉達深度學習加速器架構整合到Arm的Project Trillium上，在手機、智慧家居等裝置上實現深度學習推理。

以及英偉達GPU現在支援Kubernetes了。這是一個基於容器技術的分散式架構方案。這個技術讓英偉達的GPU進一步加速。

還有一事，英偉達驕傲的宣佈，TITAN V仍然斷貨中。

最後是不可思議的機器人環節。

釋出了機器人開發工具包Issac SDK之後，話題轉向了自動駕駛。

“我們正試圖從頭到尾瞭解這個系統，這其中包含四個最重要的方面：資料收集、模型訓練、模擬和駕駛。”老黃說，這個瞭解過程，大約花了5到7年。

老黃在現場，又展示了一把雲代駕。

640?wx_fmt=png

他把VR和自動駕駛結合起來。通過一個VR眼鏡和方向盤，就能啟動自動駕駛汽車。

雲代駕所用的平臺，是新鮮釋出的NVIDIA DRIVETM Constellation，基於兩臺伺服器。

第一臺伺服器執行NVIDIA DRIVE Sim 軟體，用以模擬自動駕駛汽車的感測器，如攝像頭、鐳射雷達和雷達。第二臺伺服器搭載NVIDIA DRIVE PegasusTM AI汽車計算平臺，可執行完整的自動駕駛汽車軟體堆疊，並能夠處理模擬資料，這些模擬資料如同來自路面行駛汽車上的感測器。

老黃又詳細介紹了英偉達的感知基礎架構。

每輛汽車都在收集PB級的資料，每個月有1500人大概標註100萬件物品。

老黃表示，英偉達並沒有試圖建立一個基於軟體定義的計算機的自主車輛系統，確切的說是在研究一個架構。

英偉達以Drive PX Parker單晶片架構為基礎建立DRIVE Xavier。這是一個四晶片系統，包含兩個Xaviers和兩個Voltas。

這臺耗能300瓦的電腦正在用於機器人汽車，將於今年晚些時候投入生產。

對了，這項技術英偉達擁有全部產權。

BTW，英偉達今天還宣佈暫停了自動駕駛測試。

可能是受此影響，釋出會一開始，英偉達股價就同步下跌，至釋出會結束，英偉達股價累積下跌6.64%。

640?wx_fmt=png

— 完 —

活動推薦

△ 點選圖片或閱讀原文

即可獲取更多詳情

聯想高校AI精英挑戰賽，覆蓋全國28個省份、8大賽區和260所高校，經過在中科大、華中科技大學、清華大學、上海交通大學等8所AI領域具有頂尖優勢的理工科高校的半決賽路演，產生最終入圍總決賽的十支參賽隊伍，並將於3月29日在北京中國科學院計算技術研究所迎來全國總決賽。

加入社群

量子位AI社群15群開始招募啦，歡迎對AI感興趣的同學，加小助手微信qbitbot6入群；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進群請加小助手微訊號qbitbot6，並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。（專業群稽核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話介面，回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

英偉達釋出全球最大GPU：效能提升10倍，售價250萬

夏乙 發自 凹非寺量子位 出品 | 公眾號 QbitAI

相關文章

夏乙發自凹非寺
量子位出品 | 公眾號 QbitAI