黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

量子位發表於2020-05-15

原文網址 : http://blog.itpub.net/69971123/viewspace-2692398/

GPU架構

曉查賈浩楠發自凹非寺
量子位報導 | 公眾號 QbitAI

深黑的皮衣，蒼白的頭髮。

熟悉的老黃又來了，但是少了寬敞的會場和粉絲的尖叫。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

因為美國疫情的原因，英偉達和其他科技公司一樣，把今年的GPU技術大會（GTC 2020）改成線上舉行。

然而讓人意想不到的是，今年的GTC甚至都沒有采用直播形式，而是直接一口氣放出7段視訊，還是黃仁勳在家提前錄好的。偷懶程度可能僅次於蘋果直接上架新品。

就算Zoom不安全，老黃你好歹用別的軟體直播一下啊。

不知道是不是聽過玩家圈裡2080Ti煤氣灶的梗，老黃昨天發了一段預熱視訊：在自家煤氣灶下方取出了一個超大的的裝置——一個裝有8個GPU的伺服器主機板，號稱全球最大圖形卡。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

老黃的意思是不是說，這臺GPU能熱到和烤箱一樣的程度呢。

從體積來看，這不可能是一臺消費級顯示卡，難道RTX 3080沒有了？

很遺憾，是的。

今年的GTC沒有RTX系列遊戲顯示卡的更新。但是已經服役3年的V100迎來了繼任者，全新基於安培架構的專業級GPU——A100。在AI訓練這件事上，一片頂過去六片。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

這臺AI運算效能怪獸進一步加強了張量運算能力，加入新的支援稀疏張量運算的張量核心，以後黃教主GPU似乎可以改稱TPU了。

至於A100效能引數如何，下面開始詳解。

首款安培架構GPU問世

V100的“V”代表Volta架構，A100的“A”則代表Ampere架構。

最新的A100 GPU整合了超過540億個電晶體，這使它榮獲全球最大尺寸的7nm製程處理器的稱號。

黃教主解釋道，如此高的整合度已經達到了現今半導體工藝的極限，A100是人類有史以來生產過的最大的處理器核心，也是人類有史以來整合度最高的計算機處理器。

英偉達大幅度提升了A100的張量計算核心（Tensor cores）的效能，FP32效能達到19.5萬億次/秒。包含6912個CUDA核心、40GB記憶體和1.6TB/s的記憶體頻寬。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

但整合了如此優秀的效能的GPU，你卻不能用它來玩任何3A大作。

A100本身也不是遊戲顯示卡。在單精度和雙精度浮點算力上，A100相比V100提升不大，但是張量核心的運算能力有了很大的提高，FP16張量算力幾乎是V100的2.5倍。

而且V100還新加入了對32位張量浮點運算（TF32）的支援，能更好地處理AI運算中的稀疏張量。

加入對稀疏張量的優化後，A100在FP16精度上的算力是V100的5倍，而在INT8上則提升了200倍！

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

這次強大的張量核心，給A100在AI上帶來了效能的飛躍。以NLP領域的BERT演算法為例，A100 比 V100在訓練速度上提升6倍，在推理速度上提升了7倍。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

視訊記憶體頻寬的提升也非常可觀，多層HBM2記憶體可提供總計1.6 TB/s的頻寬，比前代提升了78%。

英偉達將把A100應用到堆疊AI系統，就是老黃前幾天從自家烤箱中拿出來的那個「預熱」好的GPU板。這個全新的堆疊AI系統稱為DGX A100，整合了8塊A100。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

DGX A100系統能夠達到5千萬億次/s的浮點計算效能。這要歸功於這8顆A100，使用了Nvidia的第三代NVLink進行整合。

8個GPU組合在一起，意味著有320GB的GPU記憶體和12.4TB/s的記憶體頻寬。系統還包括15TB的第4代NVMe內部儲存，為AI訓練任務提供強大的支援。

這套系統的價格不菲，DGX A100的售價為19.9萬美元，堪稱史上最貴“烤箱”。

但是黃教主就是刀法嫻熟，之前對消費級顯示卡精準切削，現在對DGX A100精準“切蛋糕”。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

這套刀法叫做多例項GPU（MIG），可將單個A100 GPU劃分為多達七個獨立的GPU。

也就是說，使用DGX A100系統的研究人員和科學家可以將任務拆分成多達56個例項，將眾多小規模任務分散在強大的GPU上。

買不起A100沒關係，可以再找幾個人眾籌啊。

DGX A100系統已經開始發售，首先將應用在美國阿貢國家實驗室對COVID-19新冠病毒的研究中。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

黃仁勳說：“DGX A100系統的算力將幫助研究人員探索治療方法和疫苗，並研究病毒的傳播，使科學家能夠在數月或數日內完成數年的AI加速工作。”

除了科研機構外，英偉達表示，微軟、亞馬遜、谷歌、阿里、百度、騰訊、浪潮、聯想等大型雲服務提供商計劃將A100 整合到自己的產品中。

自動駕駛晶片效能提升6倍

在本次GTC大會主題演講中，黃仁勳宣佈，通過即將推出的Orin系統晶片（SoC）系列和A100 GPU，對現有的英偉達自動駕駛專用平臺DRIVEAGX進行擴充套件。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

此次擴充套件的範圍覆蓋從ADAS系統到DRIVEAGX PegasusRobotaxi平臺。

新DRIVEAGX平臺將會搭載一款新型Orin SoC。它的功率僅為5瓦，但效能卻可達到10TOPS。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

新平臺還憑藉兩個Orin SoC和兩塊A100 GPU，實現2000TOPS的效能，滿足自動駕駛所需的更高解析度感測器輸入，以及更先進的自動駕駛演算法。

該架構是英偉達自動駕駛SoC迄今為止最大的效能飛躍，將DRIVE系統的效能提高了6倍。

現在，已經有小馬智行、法拉第未來、Canoo等電動汽車和自動駕駛初創公司宣佈與英偉達合作，在研發的汽車或自動駕駛產品中使用DRIVEAGX計算平臺。

新邊緣AI晶片

本次線上GTC 2020還發布了兩款效能強大的EGX邊緣AI平臺產品：適用於較大型商業通用伺服器上的EGXA100，和適用於微型邊緣伺服器的Jetson Xavier NX。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100 這兩款產品能夠在邊緣提供安全、高效能的AI處理能力。

EGX Jetson Xavier NX是全球體積最小、效能最強大的AI算力平臺，適用於微型伺服器和邊緣智慧物聯網盒。

新主機板的外觀與Jetson Nano Developer Kit完全相同。在連線方面，它仍然擁有HDMI和DisplayPort介面，4個USB 3.0介面，一個microUSB介面，以及常見的GPIO介面選項。為了將攝像頭連線到系統，它還配備了兩個MIPI CSI-2埠聯結器。

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

Xavier NX本身不是新東西，但是這次英偉達開始以開發者套件形式出售，價格和單機相同，都是399美元。與Jetson Nano的被動散熱方案相比，新的開發套件採用了主動式散熱風扇。

平臺自帶英偉達提供的 “雲-native “支援，提供了邊緣AI系統部署的解決方案，包括AI模型例項，幫助使用者入門AI開發。

其他更新

除了A100、自動駕駛AGX、邊緣平臺Jetson Xavier NX外，英偉達還推出了：

1、GPU加速應用框架——NVIDIA Jarvis

2、開源社群合作，為Apache Spark 3.0提供端到端GPU加速

3、NIVIDIA醫療平臺Clara重大效能擴充

4、25/50 Gb/s智慧乙太網卡NVIDIA Mellanox ConnectX-6LxSmartNIC

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

遊戲顯示卡呢？

這次英偉達並未推出遊戲顯示卡，其實也在意料之中。

老黃向來以刀法精準著稱，去年才釋出了20系的Super顯示卡，在中端顯示卡之間插入空位，低端顯示卡又有1660卡位，實在是沒有動力升級啊。

況且在消費級顯示卡上使用7nm工藝，將比上一代的12nm製程提升太多，此前有傳言稱，3080Ti的效能比2080Ti提升40%。

果真如此的話，黃仁勳就真的把牙膏擠爆了。

安培架構都來了，RTX 3080還會遠嗎？更何況安培架構提升還這麼大，下一代遊戲顯示卡效能可期啊！

參考連結：

https://www.youtube.com/playlist?list=PLZHnYvH1qtOZ2BSwG4CHmKSVHxC2lyIPL

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/69971123/viewspace-2692398/，如需轉載，請註明出處，否則將追究法律責任。

NV歡迎Intel進入GPU市場黃仁勳如此評價
2019-04-16
IntelGPU
黃仁勳演講
2024-06-16
黃仁勳：不要學習編碼
2024-02-25
NVIDIA安培架構下MIG技術分析
2022-05-26
架構
英偉達：黃仁勳的個人安保費用約為70萬美元
2023-05-15
6-3使用GPU訓練模型
2024-08-04
GPU模型
英偉達剛剛釋出全球最大GPU：GTC2018黃仁勳演講核心內容都在這
2018-03-28
GPU
AMD釋出全球首款7nm工藝遊戲顯示卡黃仁勳：沒有AI光追平淡的產品
2019-01-10
遊戲AI
英偉達CEO黃仁勳：GPU是AI時代利器，釋出全球首款可程式設計AI引擎
2018-04-18
GPUAI程式設計
pytorch指定GPU訓練
2020-10-16
PyTorchGPU
MinkowskiEngine多GPU訓練
2021-01-04
GPU
黃仁勳：NVIDIA加速計算為新HPC市場鋪平道路
2018-11-21
科技愛好者週刊（第 257 期）：黃仁勳的 Nvidia 故事
2023-06-02
黃仁勳：遊戲、AI以及資料中心業務都是大生意
2021-09-09
遊戲AI
和梁朝偉同獲港科榮譽博士，黃仁勳與沈向洋對談Scaling Law、後訓練、機器人和愛情
2024-11-25
機器人
專訪NVIDIA CEO黃仁勳：為工程師打造“Metaverse”，提升開發效率
2021-04-21
工程師Metaverse
生成對抗網路綜述：從架構到訓練技巧
2019-02-14
架構
開源啟動！18個月Llama系列下載量近3.5億，黃仁勳：快到難以置信
2024-08-30
黃仁勳要造“第二顆地球”，對“元宇宙”意味著什麼？
2021-11-16
元宇宙
美的燃氣灶24小時售後服務熱線電話官方統一美的燃氣灶維修中心
2024-07-23
定位中型SUV車型！豐田全新Harrier 6月發售：TNGA架構+混動
2020-04-23
架構
Android 全新最新官方推薦框架MVVM架構搭建
2019-01-25
Android框架MVVM架構
一鍵換裝，讓奧特曼、黃仁勳穿上機器之心的文化衫
2024-04-28
奧特曼
黃仁勳親自給OpenAI送貨，全球首臺DGX H200開箱了
2024-04-25
OpenAI
用sed從mysqldump全備檔案中取出某張表的表結構
2020-04-12
MySql
mysql從一張表中取出資料插入到另一張表
2021-01-01
MySql
2020年煤氣考試題及煤氣證考試
2020-10-31
取出預訓練模型中間層的輸出(pytorch)
2023-03-12
模型PyTorch
2018年十大燃氣灶品牌排行燃氣灶哪個牌子好 ?
2018-07-20
方太燃氣灶24小時售後服務熱線電話官方統一方太燃氣灶維修中心
2024-07-23
老闆燃氣灶24小時售後服務熱線電話官方統一老闆燃氣灶維修中心
2024-07-23
100%英偉達的錯：黃仁勳確認Blackwell缺陷修復，明年初出貨
2024-10-24
英偉達CEO黃仁勳：4年內全自動駕駛汽車能正式上路
2018-04-11
自動駕駛
英偉達釋出全球最大GPU：效能提升10倍，售價250萬
2018-03-28
GPU
阿里雲GPU雲伺服器效能咋樣?阿里雲GPU雲伺服器最新配置以及報價
2020-09-23
阿里GPU伺服器
西門子燃氣灶24小時售後服務熱線電話官方統一西門子燃氣灶維修中心
2024-07-23
CV之後，純MLP架構又來搞NLP了，效能媲美預訓練大模型
2022-02-14
架構大模型
一加6價格曝光：8GB+256GB頂配版售價4400元？
2018-04-03

黃仁勳從煤氣灶下取出最新GPU：7nm全新安培架構，售價20萬美元，訓練效能頂6張V100

曉查 賈浩楠 發自 凹非寺量子位 報導 | 公眾號 QbitAI

首款安培架構GPU問世

自動駕駛晶片效能提升6倍

新邊緣AI晶片

其他更新

遊戲顯示卡呢？

相關文章

曉查賈浩楠發自凹非寺
量子位報導 | 公眾號 QbitAI