英偉達釋出全球最大GPU:效能提升10倍,售價250萬
夏乙 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
英偉達的新殺器又來了。
剛剛,在GTC 2018大會上,黃仁勳釋出全球最大GPU。
他說的是DGX-2。
DGX-2能夠實現每秒2千萬億次浮點運算(2 PFLOPS),效能比去年9月推出的DGX-1效能提高了10倍,售價39.9萬美元(人民幣250萬元)。
這次的GTC 2018大會在美國加州聖荷西舉行,黃仁勳照例身著皮衣登臺演講。(官方還特別提示:這次是一件全新的皮衣)
而老黃這次的演講主題,是四個Amazing:amazing graphics、amazing science、amazing AI、amazing robots。
首先,從不可思議的影像開始。
在這個環節裡,黃仁勳介紹了英偉達在影像實時光線追蹤處理方面的最新進展,展示了細膩的反射效果。
這項技術,稱為RTX。它面向圖形領域,藉助深度學習技術,實現了實時光線追蹤。
然後黃仁勳釋出了首款基於Volta架構的工作站GPU:Quadro GV100。
它支援英偉達RTX技術,支援NVLink 2,32GB容量HBM2視訊記憶體。兩個GV100相連,可以提供10000多個CUDA核心,236 teraflops的TensorFlow核心。
說著說著,老黃又開始講這句:買得越多,省得越多。(The more GPUs to buy, the more money you save.)
“來GTC,學習如何節省百萬美元。”老黃髮出誠懇的建議。
然後進入不可思議的科學環節。
我們正處在GPU計算的關鍵點,黃仁勳表示。這部分他還介紹TESLA V100等產品的多快好省,也談到一些GPU在計算和醫療影像方面的貢獻。
比如醫療影像超級計算機CLARA。
深度學習給醫療影響的識別帶來了諸多變革,但投入到實際使用中卻很難。醫院用著十幾年前生產的超聲儀,黑白渣畫質成了醫療進步的阻礙。
要等所有醫院升級裝置,可能要花上30年。
CLARA是一款醫療影像的超級計算機,讓醫院可以升級那些已有的系統。醫生可以仍然用原有的超聲、CT等裝置,然後將影像輸入超級計算機,推理出更清晰的影像。
在這個專案上,英偉達聯合了一大群醫療行業的合作伙伴:
以及在這個環節,黃仁勳又引導全場跟他念:買得越多,省得越多。
來到不可思議的AI環節。
這個環節的主題是“全球最大的GPU”。
首先,英偉達把Volta V100m每張卡的記憶體擴大到32GB。適用於記憶體密集型的深度學習和高效能運算,還能將記憶體受限的HPC應用效能提升高達50%。
其次,是全新發布的互聯結構NVSwitch,頻寬比最好的PCIe交換機高出5倍,最高支援16個Tesla V100同時以2.4TB/秒的速度進行通訊。
最後,一個全新的DGX伺服器釋出了。
黃仁勳說這個現在是全球最大的GPU了:新的DGX-2,包括20億個電晶體,12個交換機。每個GPU都可以通過光纖交換機互相通訊,比PCIe介面快20倍。
DGX-2的算力可達2千萬億次浮點運算,功耗10千瓦。這臺機器內部是NVLink連線的兩組Tesla V100陣列。
與6個月前釋出的DGX-1相比,DGX-2提速10倍。
五年前,在兩塊GTX 580上進行Alexnet訓練耗時六天,現在使用DGX-2,可以在18分鐘以內完成。
這款產品將於今年三季度發售,每臺價格39.9萬美元(人民幣250萬元)。
DGX-2具有300臺伺服器的深度學習處理能力,佔用15個資料中心機架空間,而體積則縮小60倍,能效提升18倍。
此外,英偉達還更新了CUDA、TensorRT、NCCL、cuDNN等深度學習和HPC軟體堆疊。
新版的TensorRT能快速優化、驗證和部署在超大規模的資料中心,針對更廣泛的應用加速深度學習推理。它最高可以 將深度學習推理的速度加快190倍,降低70%的資料中心成本。
TensorRT 4還整合到了谷歌TensorFlow 1.7版本中,更易於使用。
另外,NVIDIA還宣佈和ARM合作,將英偉達深度學習加速器架構整合到Arm的Project Trillium上,在手機、智慧家居等裝置上實現深度學習推理。
以及英偉達GPU現在支援Kubernetes了。這是一個基於容器技術的分散式架構方案。這個技術讓英偉達的GPU進一步加速。
還有一事,英偉達驕傲的宣佈,TITAN V仍然斷貨中。
最後是不可思議的機器人環節。
釋出了機器人開發工具包Issac SDK之後,話題轉向了自動駕駛。
“我們正試圖從頭到尾瞭解這個系統,這其中包含四個最重要的方面:資料收集、模型訓練、模擬和駕駛。”老黃說,這個瞭解過程,大約花了5到7年。
老黃在現場,又展示了一把雲代駕。
他把VR和自動駕駛結合起來。通過一個VR眼鏡和方向盤,就能啟動自動駕駛汽車。
雲代駕所用的平臺,是新鮮釋出的NVIDIA DRIVETM Constellation,基於兩臺伺服器。
第一臺伺服器執行NVIDIA DRIVE Sim 軟體,用以模擬自動駕駛汽車的感測器,如攝像頭、鐳射雷達和雷達。第二臺伺服器搭載NVIDIA DRIVE PegasusTM AI汽車計算平臺,可執行完整的自動駕駛汽車軟體堆疊,並能夠處理模擬資料,這些模擬資料如同來自路面行駛汽車上的感測器。
老黃又詳細介紹了英偉達的感知基礎架構。
每輛汽車都在收集PB級的資料,每個月有1500人大概標註100萬件物品。
老黃表示,英偉達並沒有試圖建立一個基於軟體定義的計算機的自主車輛系統,確切的說是在研究一個架構。
英偉達以Drive PX Parker單晶片架構為基礎建立DRIVE Xavier。這是一個四晶片系統,包含兩個Xaviers和兩個Voltas。
這臺耗能300瓦的電腦正在用於機器人汽車,將於今年晚些時候投入生產。
對了,這項技術英偉達擁有全部產權。
BTW,英偉達今天還宣佈暫停了自動駕駛測試。
可能是受此影響,釋出會一開始,英偉達股價就同步下跌,至釋出會結束,英偉達股價累積下跌6.64%。
— 完 —
活動推薦
△ 點選圖片或閱讀原文
即可獲取更多詳情
聯想高校AI精英挑戰賽,覆蓋全國28個省份、8大賽區和260所高校,經過在中科大、華中科技大學、清華大學、上海交通大學等8所AI領域具有頂尖優勢的理工科高校的半決賽路演,產生最終入圍總決賽的十支參賽隊伍,並將於3月29日在北京中國科學院計算技術研究所迎來全國總決賽。
加入社群
量子位AI社群15群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot6入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微訊號qbitbot6,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- 英偉達RTX 4090/4080釋出,價格效能全面介紹
- 英偉達剛剛釋出全球最大GPU:GTC2018黃仁勳演講核心內容都在這GPU
- 英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市
- 英偉達財報:2023年Q4英偉達銷售額飆升23% 成為全球最大的半導體供應商
- 英偉達GPU加速Cloudera資料平臺提升欺詐檢測能力GPUCloud
- 英偉達釋出史上最強GPU,卻叫停了自動駕駛車路測GPU自動駕駛
- 英偉達CEO黃仁勳:GPU是AI時代利器,釋出全球首款可程式設計AI引擎GPUAI程式設計
- 英偉達 RTX 40 移動顯示卡將於明年 1 月 4 日釋出,效能提升約 30%
- 加量還降價?!英偉達釋出RTX30系列顯示卡,效能翻倍,價格只要泰坦一半
- 英偉達GPU顯示卡計算能力評估GPU
- 谷歌開放TPU應對英偉達GPU挑戰谷歌GPU
- 重磅!英偉達宣佈開源 Linux GPU 核心驅動LinuxGPU
- 賽靈思釋出 ACAP,向英特爾、英偉達開炮
- 英偉達股價突破1100美元 市值達2.8萬億美元
- 英偉達VR:GPU的發展還需要一個20年VRGPU
- 英偉達證實Pascal與Turing兩代GPU將共存 但光柵效能差一倍GPU
- AMD釋出最強AI晶片,對標英偉達Blackwell,2025年上市AI晶片
- 英偉達 AD104 GPU 核心曝光,將用於 RTX 4070 TiGPU
- AI新利器,英偉達推出新一代超強GPUAIGPU
- M2 款 MacBook Pro 13 評測:GPU 效能提升最大MacGPU
- 英偉達卡皇3090 Ti發售,遊戲效能較3090僅升9%,14999元起遊戲
- 英偉達釋出電源線熔斷官方宣告:使用者未正確插入,全球已知僅50例
- AI行業買英偉達GPU,花的錢比賺的多17倍AI行業GPU
- 英偉達 RTX 4090/4080/4070 GPU型號、視訊記憶體、功耗曝光GPU記憶體
- 谷歌TPU2代有望取代英偉達GPU?測評結果顯示…谷歌GPU
- 英偉達CES開年釋出:新卡RTX 2060下週2400元開售,17款RTX筆記本同發筆記
- 百度英偉達聯合舉辦!全球規模最大智慧體大賽開幕智慧體
- 英偉達釋出全球首款自動駕駛計程車系統,將建立一支卡車隊自動駕駛
- 超算“猛將”英偉達
- 你的3080退貨了嗎?AMD連夜釋出RX 6000系列,同效能顯示卡比英偉達便宜4000
- 英偉達 RTX 新 Logo 亮相,明日釋出 Ada 架構 RTX 40 系列顯示卡Go架構
- 英偉達推出下一代Blackwell GPU,成本和能耗降低25倍GPU
- 從零開始手搓GPU,照著英偉達CUDA來,只用兩個星期GPU
- Kafka2.6.0釋出——效能大幅提升Kafka
- 英偉達財報:2020年英偉 達淨利潤23.74億美元 同比增長282%
- 英偉達釋出 RTX30 系列 ,紀念的是 21 年前的哪張神卡?
- ubuntu16.04安裝英偉達顯示卡驅動,CUDA,CUDAA,TensorFlow(GPU),opencv,numpyUbuntuGPUOpenCV
- 英偉達的AI晶片霸主之路!AI晶片