測完RTX 4090,結論居然是「價效比高」:開得起4K 144Hz高特效,功耗溫度還降低了

機器之心發表於2022-10-12

9 月 21 日,英偉達在 GTC 大會上釋出了全新架構的 GeForce RTX40 系列,新顯示卡因為臺積電的 5nm 製程,全新光追處理器和 DLSS 3 實現了效能的大幅提升。

在今天凌晨,各家媒體陸續放出了旗艦版本 RTX 4090 的測評文章,看起來最高的這個版本果然和之前英偉達聲稱的一樣效能強大,而且「最有價效比」。

RTX 4090 基於 AD102 晶片,尺寸為 608.4 平方毫米,比 RTX 3080 和 3090 使用的 GA102 小約 3%。從上代 Ampere 的三星 8N 工藝轉移到臺積電的 4N 工藝,讓  Ada Lovelace 架構的 4090 電晶體數量增加了 170%,從 283 億增加到了瘋狂的 763 億個。

圖片

與 RTX 3090 Ti 相比,4090 的流處理器、CUDA 核、Tensor 核及 RT 核和紋理單元增加了 52%。ROP 計數增加了 57%,加速時脈頻率提升了 35%。使用的還是相同的 21 Gbps GDDR6X 記憶體,在 384 位寬的記憶體匯流排上仍有 24GB 記憶體,所以是相同的 1008 GB/s 記憶體頻寬。GPU 還保留了相同的 PCI Express 4.0 x16 介面。

英偉達聲稱 RTX 4090 的功率額定值為 450W,與 3090 Ti 相同,而最高溫度已從 93℃ 略微降低到 90℃ 。最低電源要求為 850W,測試時也用了該功率的電源。

圖片

有人還放出了和 X Box X、PS5 對比的照片,是這樣的:

圖片

散熱是穩了,可是也不知道怎麼塞進機箱?

在設計方面,Founders Edition 版的 RTX4090 看起來與 3090 相似,但有一些相當明顯的變化。最引人注目的是顯示卡的寬度。3090 的寬度為 52 毫米,而新的 RTX 4090 的寬度為 61 毫米。儘管尺寸有所增加,但兩種型號的重量都相同,均為 2190 克。

另外就是 NVLink 聯結器的缺失,英偉達已經取消了 NVLink,取而代之的是依賴於 PCIe 4.0 匯流排。其他的重大變化是已升級到 PCIe 5.0 規範的 16 針電源輸入,也稱為 super catch 12VHPWR 電源聯結器。

單個 PCIe 5.0 電源聯結器可提供高達 600W 的功率,而以前需要四個 8 針電源聯結器。你不需要更換符合 PCIe 5.0 標準的 PSU,因為 RTX 4090 自帶一個 4x8 針到單個 16 針介面卡,類似於 3090 Ti 提供的 3x8 針到 16 針介面卡。

除了各類核心的數量提升,GeForce 40 還引入了 DLSS 3,這是目前 GeForce 40 系列獨有的功能。

這種新的升級 / 幀速率倍增技術令人興奮,在遊戲的測試中可以展示一些結果,但對於 DLSS 3 的全面分析還要繼續等待更多資料。DLSS 3 需要大量的測試和分析,這遠遠超出了首批評測的測試範圍。

為了進行測試,所有 GPU 都設定為以官方時鐘規格執行,測試平臺的 CPU 是 Ryzen 7 5800X3D,在 MSI MPG 上使用 32GB 雙列、雙通道 DDR4-3200 CL14 記憶體 X570S Carbon Max WiFi 主機板。

遊戲基準評測

在「看門狗:軍團」(1440p)的遊戲測試中,GeForce RTX 4090 似乎並不是非常驚豔的,但它確實是目前為止最快的 GPU——比 6950 XT 提速了約 9%。

 RTX 4090 比 RTX 3090 Ti 提速了 22%,這和二者的價格差距相應。在測評中,RTX 4090 的問題似乎不大,反而是測試平臺的 CPU 5800X3D 成了系統的主要瓶頸。

圖片

因此,測評團隊將解析度提高到 4K 來測試 RTX 4090 的幀率到底有多高,結果發現 4090 比 6950 XT 高了 60%,比 3090 Ti 高了 64%,這才是真正的 4K 的高重新整理率遊戲體驗。

同時,RTX 4090 再次比 3090 Ti 幀率高出 60%,儘管與 Radeon 6950 XT 的差距一直在增長,現在我們看到 AMD 的差距為 102%。

「孤島驚魂 6」通常在 A 卡上效能更好,在 1440p 時測試平臺的 CPU 瓶頸效應嚴重,使用 RTX 4090 只能獲得 9% 的效能提升,平均重新整理率為 187 fps。

圖片

轉換成 4K 解析度後,RTX 4090 帶來了巨大的效能增益,平均重新整理率是 164 fps,比 6950 XT 提升了 34%,提升幅度較大,相比於 RTX 3090 Ti 的提升幅度則更大,達到了 50%,比標準 3090 甚至提升了 60%。

圖片

「刺客信條:英靈殿」也是一個在 A 卡上執行良好的遊戲。測評結果表明,在 1440p 情況下,RTX 4090 的幀率比 6950 XT 高了 27%,這是一個不錯的增益,但遠不如其他對比提升,並且 RTX 4090 也僅比 3090 Ti 提高了 37%,而不是 4K 時的 60% 增益。

圖片

另一款遊戲「賽博朋克 2077」,對 CPU 和 GPU 的要求都很高。而安裝了 RTX 4090 後,我們幾乎可以肯定 CPU 會受到 1440p 的限制。測評結果表明,RTX 4090 在賽博朋克上的平均重新整理率為 145 fps,比 6950 XT 高 33%,比 3090 Ti 高 36%。

然而,4K 情況下的效能增益並沒有預期那麼大,RTX 4090 比 3090 Ti 提升了 51% ,但 RTX 4090 遠遠超過了 60 fps,這是其他 GPU 遠遠達不到的。

效能總結

Techspot 的測評共在 13 個遊戲上進行了測試,在 1440p 解析度時,GeForce RTX 4090 的平均效能大致如下:輸出幀率為 219 fps,比 6950 XT 高 44%,比 3090 Ti 高 45%。

這些都是巨大的提升,但仍不能完全說明 RTX 4090 的優秀效能,因為測試過程中系統的 5800X3D 多次受限,儘管 5800X3D 已經是一個非常快的遊戲 CPU 了。這說明目前最快的遊戲 CPU 之一仍然會在 1440p 情況下給 RTX 4090 造成嚴重的效能瓶頸。

在 4K 遊戲中,GeForce RTX 4090 平均比 RTX 3090 Ti 高 59%,比 6950 XT 高 71%,這些都是巨大的提升。同樣令人印象深刻的是,RTX 4090 在 4K 時的平均幀率為 145 fps,正好是很多高刷顯示器的上限。這確實是第一款能夠提供高重新整理率遊戲體驗的 4K GPU。 

圖片

此外,使用 Ryzen 7 5800X3D 在 1080p 時,RTX 4090 比 3090 Ti 高 28%,比 6950 XT 高 24%。

光追和新一代 DLSS

賽博朋克 2077 是首批支援 DLSS 3 的遊戲之一,下面來看看它的表現。請注意,這只是初步的評測。

在使用高質量預設的 1440p 時,RTX 4090 在賽博朋克中的平均幀率為 145 fps,比 3090 Ti 和 6950 XT 高約 35%。但是,啟用 DLSS 3 後效能提高了 90%,達到 276 fps。

DLSS 3.0 的真正優勢可以在啟用超高質量光線追蹤的情況下看到,此處 RTX 4090 在低解析度的平均幀數為 191 fps,比 DLSS 2 高了近 70%。然後在 4K 時,GeForce RTX 4090 開 DLSS 3 輸出了 113 fps,比 DLSS 2 提升了 43%。

圖片

功耗

摩爾定律終結之後,提升晶片效能的方式經常是增加功耗,這一點在旗艦 GPU 上尤為明顯。測試者嘗試以 1440p 玩「光環:無限」觀察總系統功耗,可看到 RTX 4090 實際上並沒有想象的那麼糟糕。事實上它的效能比 RX 3090 Ti 高 50%,同時功耗更低。RTX 4090 和 3090 Ti 都是 450W 顯示卡,所以從技術上講,它們的功耗應該差不多。

圖片

測試使用的 RTX 3090 Ti 將總系統使用率提高了約 50W,因為市面上並沒有 3090 Ti 的 Founders Edition,這裡使用的是使用高於規格電壓的 MSI 非公版。儘管已將其降頻至官方版本的規格,這在效能方面降低了幾個百分點,但更高的電壓意味著功耗仍然高於基本型號。

下面來看看 RTX 4090 的能效如何,透過將幀速率鎖定在 90 fps,我們可以看到每個 GPU 使用了多少功率。

圖片

固定幀率後,RTX 4090 僅消耗 215W,這意味著對於相同水平的效能,3090 Ti 需要多消耗 93% 的功率,而 6950 XT 需要多 40% 的功率。因此,儘管人們都在談論 RTX 4090 會功耗爆炸,但它在效率方面實際上是非常令人印象深刻的。

散熱

在冷卻方面,FE 版的 RTX 4090 在安裝在 ATX 機箱內且門關閉的 21℃ 房間內經過一個小時的高負載執行後,熱點達到了 83℃ 的峰值。GPU 的平均溫度達到了 72℃ 的峰值,記憶體溫度達到了 84℃ 的峰值,考慮到執行的內容的話,所有這些都是可以接受的。

圖片

另外,風扇轉速僅為 1600 RPM,執行音量僅為 42 dBA,比過去測試過的大多數高階甚至中端顯示卡都要安靜。在這個測試中,核心時鐘速度相當穩定地保持在 2730 MHz,記憶體執行在 21 Gbps,最後 GPU 功耗平均為 415W。

價效比

對於價效比,我們的使用每幀成本進行分析,看起來 RTX 4090 與 Radeon 6950 XT 和 6900 XT 水平大致相當,但比我們認為的 RTX 3080 和 6800 XT 中上一代高階 GPU 的合理選擇成本高出 30% 以上 — 實際上它比 6800 XT 貴了約 50%。

如果對比的是實際售價,RTX 4090 的吸引力就降低了。在 1440p 解析度下價效比要比 3090 Ti 略差,使其成為市場上每幀成本和整體價格最昂貴的 GPU。

4090 顯然在 4K 解析度下的效率更高,在這裡我們看到它比 6950 XT 稍微好一點,也比折扣後的 RTX 3090 略好,這對於高階產品來說是相當不錯的。

圖片


不過 3070 等中高階的顯示卡總是可以提供更高的價效比。

總結

GeForce RTX 4090 顯然是塊非常快的 GPU,人們對於它的主要擔憂是定價和功耗。很明顯,它相比上一代功耗沒有增加。另一方面,由於效能提升幅度很大,它的效率也增加了。你可以看到,當限制幀速率時,RTX 4090 在遊戲時消耗的功率比 3090 Ti 少近 50%,比 6950 XT 少近 30%。

不過這只是新世代的一個開端:在更多 RTX 40 Ada Lovelace GPU,當然還有與之競爭的 AMD RDNA3 GPU 出現之前,很難說 RTX 4090 是不是最具價效比的那一個。

但如果不計較是否交了智商稅的問題,RTX 4090 作為顯示卡是值得讚賞的,這是我們第一次能在不影響視覺效果的情況下享受真正的 4K 高重新整理率遊戲體驗。光線追蹤終於成為了一種無憂無慮的選擇,雖然 DLSS 仍然很重要,但在 4K 下享受超高質量光線追蹤的遊戲,如賽博朋克 2077、看門狗,同時幀速率保持在 60 fps 以上是一種特殊的體驗。

DLSS 3 是一個令人興奮的新功能,但我們需要深入研究它,然後才能進一步評論它的價值。

當然,這只是對於公版進行的評測,我們在僅使用原先的 Corsair RM850x 850w PSU 的情況下正常執行了 4090,FE 卡在滿負荷下長時間執行非常安靜,不比優質的中檔顯示卡更吵,而且功耗並不高。

這並不是說 RTX 4090 適合所有人。它的價格超過一萬塊錢,不過如果你決定購買 4090 的話應該不會有太多麻煩,庫存顯然很充足。

對於大多數人來說,使用一半價格,或是四分之一價格的 GPU 來享受遊戲才是正常情況,我們可以等待 RTX 4070,當然還有 AMD 即將推出的 RDNA 3 系列。

參考內容:

https://www.theverge.com/23398201/nvidia-rtx-4090-review-test-benchmark

https://www.techspot.com/review/2544-nvidia-geforce-rtx-4090/

相關文章