十年磨一劍:英偉達最「閃」GPU 登場,揭曉新一代晶片架構圖靈

机器之心發表於2018-08-14

從今年年初開始,英偉達將釋出新一代架構的訊息就已經傳的沸沸揚揚,傳聞稱架構代號也許會是「Ampere」,也可能是「Turing」。苦等半年,今日新一代的 Quadro(英偉達繪圖系列)晶片架構最終揭曉:圖靈。在今早 SIGGRAPH 大會上,英偉達創始人兼執行長黃仁勳在其主題演講上釋出了這一新架構,除此之外還推出了全新的 RTX 系列 GPU。

撰文 | Tony  Peng (彭君韜),機器之心海外團隊

作為計算機圖形領域的頂會,SIGGRAPH 彙集了多媒體、互動和動畫界的前沿研究人員。作為影像處理界的大佬,英偉達和黃仁勳幾乎每年都會來 SIGGRAPH 推銷一下自家的新卡,今年也不例外。

當老黃從工作人員手上接過即將釋出的新 GPU 時,底下的觀眾覺得有點不對勁兒——這款晶片太閃了。燈光反射在 GPU 的表面外殼上,照著底下的觀眾和攝影師們都快睜不開眼。

老黃在舞臺上不斷地打趣:

「這張卡上的反光真是做得完美無缺!」

「漂亮嗎,你不覺得它長的很漂亮嗎?!」

「事實證明,這是原力啊!(老黃也是星球大戰粉)」

老黃當然不是外表協會。如果空有一副皮囊,這塊新卡又怎麼能被稱為是「英偉達 2006 年以來最大的一次飛躍呢?」

閃耀的新卡:RTX

在今年三月矽谷舉辦的 GDC 大會上,老黃推出了 RTX 技術,即所謂的「光線跟蹤」,可以為內容創作者和遊戲開發者提供實時、達到電影質量的畫面渲染。

在今天的釋出會上,老黃重新播放了 5 個月前的演示視訊:兩個背地裡說黑武士壞話的帝國風暴兵被罰到雪地裡站崗。對啊,還有什麼比渲染出黑武士身上那副盔甲更好的演示視訊呢?

RTX 技術在當下技驚四座,每 pixel 可以跑 5 次光線追蹤,但重頭戲卻留到了今天才揭曉:英偉達其實只用了一塊 GPU 來支援視覺渲染的算力!

這就是今天英偉達在 SIGGRAPH 上推出的 Quadrio RTX GPU,也是世界上首款實現光線跟蹤的 GPU。

十年磨一劍:英偉達最「閃」GPU 登場,揭曉新一代晶片架構圖靈

「RTX 是自 2006 年(G80/Tesla)以來英偉達推出的最重要的一塊 GPU。」

老黃一句話,給這塊新卡先定下了個基調。

再來看下這塊卡的引數:

  • 最高每秒 10 GigaRays 的光線跟蹤;

  • 峰值 16 TFlops;

  • 每秒 500 萬億張量運算;

  • NVLink 技術提供 100GB/s 的頻寬;

全新 Quadro 架構圖靈,新增 AI 功能

伴隨著 RTX 的出爐,英偉達也引出了 Quadro 的新一代架構——Turing(圖靈)。

歷經英偉達十年的打磨,Turing 架構相比於 Quadro 過去的架構 Pascal,在 Shader Compute 的基礎上增加了具備 AI 訓練和推理能力的 Tensor Core 和支援光線跟蹤的 RT Core。

Tensor Core 在半精度浮點數 FP16 下提供 128 TFlops 的算力,Int8 精度下為 250 Tops,Int4 精度下為 500 Tops。

RT Core 則是首次亮相,與 Pascal 架構相比,新的 RT Core 可以將光線跟蹤的速度提高至 25 倍。

RTX 系列晶片擁有 4,608 個 CUDA 核心,可同時提供高達 16 萬億次浮點運算和每秒 16 萬億次整數運算。RTX 系列具有 16 GB GDDR6 記憶體以加速發展,記憶體容量可以擴充套件至 96 GB。

十年磨一劍:英偉達最「閃」GPU 登場,揭曉新一代晶片架構圖靈

老黃現場演示了新卡的視覺渲染能力:在相同的物理材料和燈光下,基於 Turing 架構的 RTX 可以實現包括區域光、全域性照明、反射、折射、景深、漫反射、焦散等視覺效果。

話不多說直接上圖:上圖是用傳統處理器(沒有明細是哪一款)新增的區域光,下圖是用 Turing 架構下的效果,效果涇渭分明。

十年磨一劍:英偉達最「閃」GPU 登場,揭曉新一代晶片架構圖靈

十年磨一劍:英偉達最「閃」GPU 登場,揭曉新一代晶片架構圖靈

再看這輛對保時捷的渲染:(老黃說了,所有演示的渲染都是實時的,英偉達不耍虛招)

十年磨一劍:英偉達最「閃」GPU 登場,揭曉新一代晶片架構圖靈

十年磨一劍:英偉達最「閃」GPU 登場,揭曉新一代晶片架構圖靈

新架構相比於 Pascal 在視覺渲染上提升了 6 倍的速度。這種提升除了歸功於光線跟蹤技術和更好的著色效果外,英偉達還引入了一項新技術——Deep Learning Anti-Aliasing(DLAA)基於深度學習抗鋸齒演算法。簡單來說,DLAA 可以利用深度學習演算法來消除較低解析度的渲染,然後消除鋸齒從而獲得更高的影像質量。

和硬體配套,英偉達同時推出了一個全棧的軟體平臺 NVIDIA RTX,將渲染技術和 AI 能力、算力等結合。

該平臺還將開源 NVIDIA 材料定義語言(MDL),這是一種用於定義基於物理的渲染材料的程式語言;也將支援 Pixar 上的通用場景描述(USD)語言。

英偉達相信,Turing 能夠啟發價值 2500 億美元的視覺效果市場,包括設計、數字內容創作(DEC)、建築/工程/施工專案(AEC)、視覺化、和電影電視等傳統媒介。

兩千刀你買不了上當

所以,晶片最後多少錢呢?

RTX 系列將會有三名成員:RTX 5000/RTX 6000/RTX 8000。

基本款 RTX5000,16 GB 記憶體,每秒 6 gigarays,售價 2,300 美金。

進階款 RTX6000,24 GB 記憶體,每秒 10 gigarays,售價 6,300 美金。

高階款 RTX8000,48 GB 記憶體,每秒 10 gigarays,售價 10,000 美金。

如果你想要搭建一套渲染農場,英偉達秉持著「多買多省」的原則,推出了 Quadro RTX Server—8 塊 RTX 8000,配合最新的 Quadro Infinity 軟體,將在 2019 年第一季度推出,售價$125,000。

Quadro RTX Server 預裝了內容建立和渲染軟體,提供功能強大且易於部署的渲染解決方案,可從小型安裝擴充套件到最大的資料中心,僅佔 CPU 渲染農場成本的四分之一,空間減至十分之一,能耗十一分之一。

新品上架,自然引發哄搶。老黃也曬出了英偉達的朋友圈:Adobe、Autodesk、西門子 NX、DavinciResolve 等 20 家科技新貴、工作室和製作公司都已經購買了 RTX 的新卡和伺服器。

靠圖形處理髮家,靠 AI 賣卡致富,25 歲的英偉達正在走向第三個階段:AI 賦能底層。配備針對機器學習的算力,重構圖形處理器的架構。

GPU 的全面 AI 化,是否也指日可待呢?

相關文章