英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

机器之心發表於2018-12-05

英偉達在 NeurIPS 大會上釋出最新款產品 Titan RTX,這是去年 Titan V 的「繼承者」:價格更低,視訊記憶體更大,效能更強,且使用圖靈架構,因此具備強大的光線追蹤能力。

今年英偉達釋出了新一代 GPU 架構 Turing 和 Quadro RTX 系列,然後又釋出了三款消費級 GeForce RTX 顯示卡,以及第一款 Turing Tesla T4。然而,英偉達的產品線中通常會有一款比較高階的顯示卡,這就是 Titan。Titan 不是旗艦卡也不算是消費級顯示卡,但它仍然是英偉達產品中非常有趣的存在,它是最快的顯示卡,其他卡無法企及,現在它成為英偉達主推的工作站計算顯示卡。

去年此時,英偉達在 NeurIPS 大會上釋出了售價 3000 美元的 Titan V。今年英偉達再度選擇在 NeurIPS 釋出最新的 Titan 顯示卡——Titan RTX。Titan RTX 將於本月稍晚時候大批次上市,是英偉達為工作站計算和光線追蹤提供的一款重量級產品,該顯示卡售價 2500 美元。

英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

Titan RTX、Titan V、GeForce RTX 2080 Ti、Telsa V100 引數對比圖。

從上圖數字來看,Titan RTX 像是加強版的 GeForce RTX 2080 Ti。儘管它並非消費級顯示卡,但它與英偉達的消費級旗艦顯示卡 RTX 2080 Ti 一樣,都基於 TU102 GPU,不過 RTX 2080 Ti 使用的是 GPU 的輕微縮小版,而 Titan RTX 使用的是完整晶片,類似於英偉達最好的 Quadro 晶片。此外,Titan RTX 的功能與 Quadro RTX 6000 非常相似。也就是說盡管 Titan RTX 並不是旗艦顯示卡,它也不屬於第二梯隊:其能力和速度與英偉達最好的 TU102 顯示卡相當,因此它屬於頂級。

英偉達對其市場地位進行了觀察,隨著 Titan V 於去年上市,英偉達逐漸轉向,不再將 Titan 定位為比 GeForce 具備更多記憶體和稍高效能的「專業消費級」顯示卡,而是更多地偏向於為非圖形學任務服務的專業級工作站顯示卡。使用伺服器級 GV100 GPU 縮小版的 Titan V 輕鬆實現了英偉達這一轉向,但它仍受伺服器級 GPU 的限制。現在英偉達重新使用更接近工作站級別的 GPU TU102,再次調整了其晶片之間的平衡。但是 Titan RTX 仍然是英偉達的工作站計算顯示卡,此外由於圖靈架構追蹤光線的能力,Titan RTX 也將是最適合內容創作者的光線追蹤顯示卡。

英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

深入來看,令 Titan RTX 與英偉達其他晶片都不一樣的原因有三,尤其是 GeForce RTX 2080 Ti。原始效能是原因之一,我們能看到 Titan RTX 在著色、紋理生成和計算的效能提升了 15%,記憶體頻寬和畫素吞吐量增加了大約 9%。

但是,對英偉達真正市場——資料科學家和其他計算使用者來說,重點是張量核心。英偉達修改了 GeForce 軟體使用條款,禁止在資料中心執行深度學習等應用,這對專業市場影響很大。在圖靈的最高精度 FP16 模式中,圖靈能夠不斷進行 FP32 累積來獲取更高的精度,然而在 GeForce 顯示卡上該操作被限制在半速吞吐量。而最新發布的 Titan RTX 移除了該限制,這款新型晶片可以在其張量核心上全速進行 FP32 累積。

英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

鑑於英偉達的張量核有十幾種模式,這似乎是 GeForce 和 Titan 之間存在的奇怪區別。然而對於資料科學家而言,這非常重要;FP32 累積對於神經網路訓練來說通常是必需的(FP16 累積沒有足夠的精度),特別是在需要購買 Titan 和 Tesla 晶片的領域。所以這個微小的變化是對資料科學家使用者的價值定位重要組成部分,因為英偉達沒有提供更便宜的、具有 Titan RTX 可以達到的頂級 130 TFLOPS 張量效能的顯示卡。

最後一個因素是記憶體容量。GeForce RTX 2080 Ti 是一款 11GB 記憶體的顯示卡,Titan RTX 是一款 24GB 記憶體顯示卡。對於遊戲玩家來說,11GB 都算大材小用了,但是再新增 13GB 視訊記憶體可以打造或打破大型資料集。英偉達非常瞭解他們的市場。

英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

除了市場定位之外,Titan RTX 的推出也意味著其餘的張量效能優勢最終將會出現在 Titan 級卡上。圖靈架構引入了對低精度模式的支援,這有助於進一步將 Titan RTX 與去年的 Titan V 區分開來。總體而言,原本考慮 Titan V 的資料科學家們會注意到 Titan RTX 將視訊記憶體容量提高了一倍,並將張量效能提高了 20%(精度較低時提升更多),以及圖靈架構的所有其他改進。如果這還不夠,英偉達此次還啟用了 NVLink 功能(它在 Titan V 上被停用),因此工作站使用者也可以透過連線兩張 Titan RTX 卡進行擴充套件,以獲得更高的效能。

與此同時,英偉達也瞄準了這款顯示卡的內容創作者使用者。資料科學家仍然是主要使用者,但鑑於圖靈架構對光線追蹤進行了大量投入,英偉達似乎也應該在這裡試驗一下,看看哪個市場適合高階但非 Quadro 的光線追蹤顯示卡。嚴格來說 Quadro 6000 在這裡應該是優越的(如果僅僅看驅動程式和支援的話),但它價格高昂。因此,看看英偉達將為 2500 美元的光線追蹤顯示卡 Titan RTX 開闢什麼樣的市場會很有趣。

英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

雖然英偉達第一個注意到該卡並非真正用於遊戲,但是自 Titan 使用 GeForce 驅動程式堆疊以來,即使 Titan V 也出售給一些遊戲玩家,Titan RTX 的情況可能將大致相同。由於 Titan V 是唯一使用 GeForce 驅動程式的 Volta 架構卡,其在遊戲支援方面很尷尬,而圖靈架構則無處不在。所以 Titan RTX 應該表現得更像一個稍快的 2080 Ti,沒有我們在 Titan V 上玩遊戲時看到的那麼多效能不一致。

在設計方面,與其前任一樣,Titan RTX 也非常貼近 GeForce 系列的風格。值得注意的是,英偉達在這一代產品中使用了露天雙風扇散熱器,而不是傳統的鼓風機,如 Titan V 或目前的 Quadro 卡。正如我們在 GeForce 卡上看到的那樣,露天雙風扇散熱器可以最大限度地增大氣流並降低溫度。但是對於 Titan 而言,這是一個混合包,因為英偉達允許將 Titan RTX 與 NVLink 配對。露天冷卻卡需要使用者更多的關注,而鼓風機在工作站中基本上設定好後就可以忽略。然而,Titan RTX 顯示卡的 TDP 功率為 280W,這是圖靈卡中功率最高的,比 Titan V 高 30W。人們據此可以看出為什麼英偉達有興趣將冷卻效能最大化放到其他優先順序之上。這也意味著理論上 Titan RTX 的平均時脈頻率應該比 Quadro 略高,因為它具有更多的散熱和 TDP 餘量;所以至少現在為止,它可能是所有 TU102 卡中最快的。

Titan RTX 是一款非常典型的英偉達設計顯示卡。它具有與 Quadro 和 GeForce 顯示卡相同的埠配置,具有 3x DisplayPort 1.4 輸出、HDMI 2.0b 埠和支援 DP alt 模式的 USB-C 埠,以及 VR 耳機的 VirtualLink 標準。Titan 的獨特之處當然是它的金色配色方案,讓它不會與 GeForce 混淆。英偉達為 Titan RTX 取的綽號是「霸王龍」(T-rex),這似乎是第一次有人提供 T-rex 黃金版。

無論如何,資料科學家和其他任何想要了解英偉達工作站「恐怖」之處的人,請準備好錢,準確地說是 2500 美元。對於英偉達來說,這個價格實際上比 3000 美元的 Titan V 還要低一些(TU102 製造成本更低,特別是沒有 HBM2),但它仍然是一款昂貴的顯示卡。這款新顯示卡 Titan V 將在本月本月晚些時候出現在英偉達網站(http://www.nvidia.com/titan-rtx)。

活躍在 NeurIPS

英偉達把最高階的 Titan 顯示卡放在 NeurIPS 大會期間釋出,這不是一個巧合:去年的 NIPS 大會上,黃仁勳正是在英偉達舉辦的晚宴上釋出了 Titan V,還現場贈送了顯示卡。

今年,英偉達在 NeurIPS 上同樣活躍,一篇「GAN 生成影片」的論文再次引來了人們的關注。其中人工智慧技術與傳統影片遊戲引擎相結合,這種混合圖形系統未來有望應用於遊戲、電影和虛擬現實等領域。

英偉達放出的 Demo 影片是一個模擬駕駛環境,其中玩家可以在 AI 生成的城市中駕駛車輛——重要的是,這個演示影片僅需一塊 GPU 即可實現(不過得是 Titan 級別的)。

英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

真實影像與 AI 生成影像的對比。

英偉達的系統使用幾個步驟來生成圖形。首先,研究人員收集訓練資料,這些資料來自用於自動駕駛研究的開源資料集。隨後,計算機對這些影像進行分割處理——每一幀都被分成不同的類別:天空、汽車、樹木、道路、建築物等。然後,對分割後的資料訓練生成對抗網路(GAN),以生成虛擬影像。

論文:Video-to-Video Synthesis

英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

我們研究了影片到影片的合成問題,目標是學習從輸入源影片(例如,一系列的語義分割掩碼)到輸出照片級影片的對映函式,輸出影片精確地描繪了源影片的內容。與之對應的影像問題,即影像到影像合成問題是目前流行的研究課題,而影片到影片的合成問題則在文獻中很少出現。在沒有理解時間動力學的情況下,直接把已有的影像合成方法應用到輸入影片通常會導致視覺效果差、時間不連貫的影片輸出。

在本文中,我們提出了一種新型的生成對抗網路框架下的影片到影片合成方法。透過精心設計生成器和判別器架構,結合空間-時間對抗目標函式,我們在多種輸入影片格式下生成了高解析度、時間連貫的照片級影片,其中多種形式的輸入包括分割掩碼、草圖和姿態圖。

在多個基準上的實驗結果表明,相對於強基線,我們的方法更具優越性。特別地,我們的模型可以合成長達 30 秒的 2K 解析度街景影片,與當前最佳的影片合成方法相比具備顯著的優勢。最後,我們把該方法應用到未來影片預測中,結果超越了多個當前的最佳系統。

英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

英偉達釋出「霸王龍」Titan RTX:價格降低,本月上市

圖 1:Cityscapes 結果。其中左上為輸入影像、右上為 pix2pixHD 生成的影像、左下為 COVST 生成的影像、右下為本論文提出方法生成的影像。

參見:畫個草圖生成 2K 高畫質影片,這份效果驚豔研究值得你跑一跑

這一研究目前已經開源:

  • 專案連結:https://github.com/NVIDIA/vid2vid


參考內容:

  • https://www.anandtech.com/show/13668/nvidia-unveils-rtx-titan-2500-top-turing

  • https://www.theverge.com/2018/12/3/18121198/ai-generated-video-game-graphics-nvidia-driving-demo-neurips

相關文章