AMD Radeon RX 7900 XTX、RX 7900 XT 顯示卡釋出,899 美元起

win7之家-小李發表於2022-11-04

win7之家 11 月 4 日訊息,預熱大半年之後,AMD 終於揭開了它 RDNA 3 架構的面紗,隨著比上一代便宜的 Radeon RX 7900 XTX(999 美元)和 Radeon RX 7900 XT 顯示卡(899 美元)的到來,A 卡似乎再次擁有了與 N 卡爭一爭的機會。

首先,大多數細節與我們此前爆料過的 AMD RDNA 3 架構和 RX 7000 系列預期記憶體一致。RDNA 3 將使用臺積電 5nm 晶片,內含一個主 GCD (圖形計算模組) 以及 6 個 MCD (記憶體快取模組)。

此外,RDNA 3 在架構上也有著很多底層的改進,例如更多的計算單元和更多的 GPU 著色器。

從 AMD 給出的資料來看,這一代顯示卡繼續專注於功率和能效方面,據稱 RDNA 3 的每瓦效能相比 RDNA 2 可提高 50%。這一點與抬高功耗壓榨效能的英偉達 RTX 4090 有點不一樣。外媒認為 AMD 應該是覺得沒有必要在預設情況下將耗電量提到那種高度。

讓我們先來快速瀏覽一下核心規格,並將其規格與上一代 RDNA 2 和英偉達 RTX 4090 橫向進行一下對比。

win7之家瞭解到,AMD RX 7900 XTX 沒有學英偉達,還是傳統 8Pin 介面,功耗 355W 只需兩個 8Pin,而 RX 7900 XT 300W 同樣是 2 個 8Pin。

AMD 有兩個版本的 Navi 31 GPU,其中更高規格的型號命名為 RX 7900 XTX ,這張卡啟用了完整的 GCD 和 6 個 MCD,而 RX 7900 XT 則只啟用了 96 個計算單元中的 84 個以及 5 個 MCD。

從技術上講, RX 7900 XT 第六個 MCD 可能只是物理遮蔽掉了,但不管怎樣它都沒辦法自行啟用,而且這張卡本身也沒有額外的 4GB GDDR6 視訊記憶體給它用,所以開核什麼的就別想了。

與競爭對手相比,RX 7900 XTX 在算力方面仍落後於 RTX 4090,畢竟英偉達還有 Tensor 加持,可實現更強的 AI 處理能力。

外媒認為,考慮到 RX 6950 XT 在 1080p 和 1440p 上已經幾乎趕上 RTX 3090 Ti(4K 則落後 5% 左右),但它理論上卻少了 40% 的原始計算效能。因此,紙面上 RX 7900 XTX 比 RTX 4090 少 32% 的計算量可能無法代表什麼。

至於另一款,RX 7900 XT 應該不是用來對標 RTX 4090 的,我們只需要考慮它將如何與 RTX 4080 競爭就夠了。

從引數方面來看,它有著更多的視訊記憶體和更高的頻寬,再加上 16% 的計算能力優勢。因此,即使 RDNA 3 著色器的效能有所下降 (後續介紹),AMD 這一代卡看起來也應該非常有競爭力,至少紙面上可以與英偉達次旗艦碰一碰,何況它還低了 200 美元。

在過去兩代的 RDNA 架構上,AMD 已多次強調其能效方面的優勢,而 RDNA 3 則延續了這一重點。

AMD 聲稱,與 RDNA 2 相比,新一代 GPU 每瓦效能提高了 54%,而 RDNA 2 的 PPW 比 RDNA 提高了 54%。在過去的三代中,AMD 的效率幾乎可以說是指數型上升。

我們以上一代 RX 6900 XT 為例,它的效能基本上是上一代 RX 5700 XT 的兩倍(1440p 超解析度),而外媒實測功耗大約在 308W,而 5700 XT 則為 214W,所以效率應該是提高了 38%。

那麼面對 RTX 40 系列的進逼,AMD 該如何繼續提高效率?這可能在很大程度上都要歸功於臺積電 N7 到 N5 (7nm 到 5nm) 的迭代演變,但架構上的更新肯定也有那麼一些幫助。

新一代 RDNA 3 統一了計算單元,各個都有 64 個雙發流處理器 (GPU 著色器)。,相當於 RDNA 2 的兩倍,而且 AMD 可以向每個 SIMD 單元傳送不同的工作負載,又或者它可以讓兩者在同一型別的指令上協同工作,進而提高效率。

值得注意的是,最新的 AMD、Intel 和 Nvidia GPU 現在全都是 128 著色器設計 ——AMD 的計算單元 (CU),Nvidia 的流媒體多處理器 (SM),Intel 的 Xe 向量引擎 (XVE)。

不單單是 CU 中 GPU 著色器數量翻倍,AMD 的 CU 總數也從 80 增加到 96 個。相比之下,AMD 的 Navi 31 的著色器數量可達 Navi 21 的 2.4 倍,而功耗只增加了 18%。

此外,AMD 還提高了它的 AI 加速器的效能,而之前該公司很少談論這一被英偉達碾壓的領域。我們無法確定新款算力如何,但 AMD 稱其 AI 加速器支援 INT8 和 BF16 (腦浮點 16 位) 操作。因此,它們可能至少擁有部分類似於 Nvidia 的 Tensor 核心,但支援的指令集總數並不相同。

但不管怎麼說,AMD 表示其新的 AI 加速器相比上一代提供了 2.7 倍的改進 —— 兩倍的數量,更多的處理器,以及略高的吞吐量。

最後,AMD 表示他們已經最佳化了光線追蹤加速器,RDNA 3 版本可帶來 1.5 倍的光線追蹤效能,還擁有新的專用指令和改進的 BVH (光追 / 盒) 排序和遍歷,這個詞具體指什麼還沒完全搞清楚,但我們肯定新卡在光線跟蹤和改進的光柵化效能上有一個巨大的飛躍,至於相比 4090 如何還需要等後續評測。

除了計算單元,RDNA 3 還對許多其他領域進行了大升級,例如 AMD Radiance 顯示引擎,或基本的影片輸出支援。

此外,AMD 還升級了 RDNA 3,支援 DisplayPort 2.1 (英偉達 (*^_^*)),這也意味著 AMD 從此成為第二家支援 DP2.x 的 GPU 公司(英特爾 Arc 是首款)。

不過英特爾僅支援每通道 10 Gbps 或總共 40 Gbps 的頻寬,而 DP2.1 實際上可支援單通道 20 Gbps 或總共 80 Gbps 的頻寬。

不過目前來看 AMD 也不支援 20 Gbps,而是選擇了 13.5 Gbps 這一中間級別,因此 AMD 新一代 GPU 可實現 54Gbps 的總頻寬,這基本上是 DP1.4a 的兩倍。

得益於 DSC (顯示流壓縮) 技術,AMD 可以在 4K 解析度上支援高達 480Hz 的重新整理率,或在使用其 DisplayPort 2.1 介面的 8K 顯示器上支援高達 165Hz 的重新整理率。值得一提的是,預計首批 DisplayPort 2.1 顯示器和電視將在 2023 年初上市,名單見圖。

AMD 還透過 RDNA 3 大幅改進了媒體引擎。這一點已經或多或少地得到了曝光,但 Navi 31 驚喜的地方在於擁有雙媒體引擎,完全能夠支援兩個同時執行的 8K60 流 —— 可以是編碼、解碼,也可以並聯 / 組合起來以提高編碼單個流媒體的效能。

影片引擎的另一個更新之處在於對 AV1 的支援,這意味著所有三家 GPU 廠商從此都已經對 AV1 提供完整的硬體編碼 / 解碼支援。,希望我們後續能看到更多的軟體解決方案和流媒體服務支援 AV1 而不是 H.264。

此外,影片引擎的頻率比以前更高 (我們不確定高多少),AMD 還指出它有 AI 增強的影片編碼能力,不過具體的也同樣需要等後續硬體評測時再去做一些影片編碼測試,敬請期待。

與此同時,AMD 也給出了一些 Radeon RX 7900 XTX 的初始效能資料,例如使命召喚、賽博朋克 2077、看門狗、生化危機 8 等等,相對於上一代 RX 6950 XT 大約有 50% 到 70% 的提升。

我們不能保證上述效能宣告的準確性,但 AMD 選擇這些遊戲肯定是有原因的。

還有,AMD 又一次介紹了其 FidelityFX 超級解析度 (FSR) 技術。這是老生常談的內容了,我們直接略過。

據介紹,AMD 目前已擁有超過 216 款遊戲和應用支援 FSR,但大多數都是 FSR 1.X,畢竟它是開源的,所以很容易整合,而且已經有一年多的時間了,給開發者準備的時間也更長,而 FSR 2.0 則年輕得多,在今年 5 月才釋出,目前只在少數遊戲中才能看到。

展望未來,AMD 的 FSR 將繼續“充滿吸引力”。我們當然也希望 FSR2 的普及率能夠超過 FSR1.x,畢竟它能夠為使用者帶來更好的體驗,不管是什麼平臺,而且遊戲也能夠同時支援這兩種技術,可能在部分場景中 (如低端顯示卡和整合顯示卡上) FSR1 對某些使用者更適合。

據稱,FSR3 技術將在明年的某個時候釋出,它將尋求某種形式的補幀或插幀,有點類似於英偉達的 DLSS 3 所做的方向。AMD 沒有透露太多細節,部分原因可能是 FSR3 還沒有完全想好後續怎麼做,但在早期測試中它可以將部分遊戲的幀數提高兩倍。

相關文章