已經過去五年了,AMD 透過釋出基於全新 Zen 架構的第一代 Epyc CPU,重新點燃了伺服器和資料中心的雄心。自那時以來,Epyc 已經在伺服器處理器市場份額中取得了顯著的進展,蠶食了英特爾的市場份額。
最初的 Epyc,代號為 Naples,被正式命名為 7001 系列,最高可達 32 個核心和 64 個執行緒。2019 年,AMD 宣佈了 Epyc 7002 系列,代號為 Rome,不僅將旗艦 CPU 的核心和執行緒數量加倍,還透過使用更精細的 Zen 2 架構進一步提高了效能。2021 年,AMD 推出了 Epyc 7003 系列,代號為 Milan,在高階產品中保持了 64 個核心和 128 個執行緒的處理能力,但透過使用最新的 Zen 3 架構和平臺改進,進一步提高了效能。
與桌面晶片一樣,AMD 故意保持了前三代產品在同一個插槽(SP3)和平臺上,使得舊的主機板可以透過簡單的 BIOS 更新升級到第三代處理器。五年以上的平臺壽命仍然是 Epyc 的一個重要賣點,為資料中心架構師提供了未來的升級路線圖。
Epyc 7003 系列將是最後一代使用 SP3 插槽的產品。AMD 已經明確表示,將在新的 SP5 插槽上釋出下一代 Epyc 7004 系列,使得未來的晶片與當前的所有模型不相容。變化不僅僅是插槽的更換,未來的處理器(代號為 Genoa)將採用 DDR5 記憶體、更多的記憶體通道、更多的核心、更多的快取和更高的效能。注意到這個趨勢了嗎?
AMD 的路線圖執行與英特爾形成鮮明對比,後者由於製造延遲而推遲了伺服器微架構的釋出。當然,英特爾仍然佔據著超過 80% 的 x86 伺服器 CPU 出貨量,但路線圖不一致的缺點卻成為了 AMD 的幸運之事。
Epyc 7003系列的詳細介紹
在探討Epyc 7003系列的效能引數之前,我們需要更詳細地瞭解Epyc各個世代之間的關鍵變化。
圖表顯示,Epyc 7002和7003之間的效能提升比第一代和第二代之間的差異要小。這是可以預期的,特別是當下一代晶片顛覆了上述連續性時。
從Zen 2到Zen 3的轉變可以帶來20%的效能提升,當使用相同核心和執行緒數量的晶片進行評估時。具體的改進取決於Zen 3如何執行特定的工作負載,極端情況下甚至可以達到50%的效能提升。然而,20%是普遍的回報。大部分的效能提升來自於對Zen架構的各種方面的改進,包括使用更深的緩衝區、增強的分支預測和更寬的排程機制。這些小的變化彙整合為了對時間就是金錢的行業的有意義的改進。
另一個驅動效能提升的因素是AMD對晶片快取分割槽的重新架構。在Zen 2中,每個核心都有訪問16MB的L3快取的許可權,兩個複合體(CCX)組成一個單獨的CCD。Zen 3沒有改變CCD中的核心數量(仍然是八個),但取消了CCX。結果是每個核心都可以訪問32MB的快取,這可能會降低虛擬化等快取密集型應用程式的延遲。這是一個細緻的變化,是對工作負載模擬的直接結果。
儘管大部分效能都是透過執行八通道DDR4記憶體來實現的,但AMD表示,它已經響應了客戶的需求,在Epyc 7003系列上執行六通道記憶體——這是在Epyc 7002上沒有的功能。出於多機架安裝的成本節約考慮,我們認為這是一個明智的舉措,就像引入安全巢狀分頁(Secure Nested Paging)一樣。
Epyc 7003系列型號
型號 | 核心數/執行緒數 | TDP | L3快取 | 基礎頻率 | 加速頻率 | 釋出時MSRP |
---|---|---|---|---|---|---|
Epyc 7773X | 64/128 | 280W | 768MB | 2.20GHz | 3.50GHz | $8,800 |
Epyc 7763 | 64/128 | 280W | 256MB | 2.45GHz | 3.40GHz | $7,890 |
Epyc 7713 | 64/128 | 225W | 256MB | 2.00GHz | 3.67GHz | $7,060 |
Epyc 7713P | 64/128 | 225W | 256MB | 2.00GHz | 3.67GHz | $5,010 |
Epyc 7663 | 56/112 | 240W | 256MB | 2.00GHz | 3.50GHz | $6,366 |
Epyc 7643 | 48/96 | 225W | 256MB | 2.30GHz | 3.60GHz | $4,995 |
Epyc 7573X | 32/64 | 280W | 768MB | 2.80GHz | 3.60GHz | $5,590 |
Epyc 75F3 | 32/64 | 280W | 256MB | 2.95GHz | 4.00GHz | $4,860 |
Epyc 7543 | 32/64 | 225W | 256MB | 2.80GHz | 3.70GHz | $3,761 |
Epyc 7543P | 32/64 | 225W | 256MB | 2.80GHz | 3.70GHz | $2,730 |
Epyc 7513 | 32/12 | 200W | 128MB | 2.60GHz | 3.65GHz | $2,840 |
Epyc 7453 | 28/56 | 225W | 64MB | 2.75GHz | 3.45GHz | $1,570 |
Epyc 7473X | 24/48 | 240W | 768MB | 2.80GHz | 3.70GHz | $3,900 |
Epyc 74F3 | 24/48 | 240W | 256MB | 3.20GHz | 4.20GHz | $2,900 |
Epyc 7443 | 24/48 | 200W | 128MB | 2.85GHz | 4.00GHz | $2,010 |
Epyc 7443P | 24/48 | 200W | 128MB | 2.85GHz | 4.00GHz | $1,337 |
Epyc 7413 | 24/48 | 180W | 128MB | 2.65GHz | 3.60GHz | $1,825 |
Epyc 7373X | 16/32 | 240W | 768MB | 3.05GHz | 3.80GHz | $4,185 |
Epyc 73F3 | 16/32 | 240W | 256MB | 3.50GHz | 4.00GHz | $3,521 |
Epyc 7343 | 16/32 | 190W | 128MB | 3.20GHz | 3.90GHz | $1,565 |
Epyc 7313 | 16/32 | 155W | 128MB | 3.00GHz | 3.70GHz | $1,083 |
Epyc 7313P | 16/32 | 155W | 128MB | 3.00GHz | 3.70GHz | $913 |
Epyc 72F3 | 8/16 | 180W | 256MB | 3.70GHz | 4.10GHz | $2,468 |
這些是AMD Epyc 7003系列的各種型號,包括它們的核心數、執行緒數、TDP、L3快取、基礎頻率、加速頻率和釋出時的MSRP(建議零售價)。
這些型號可以分為幾類:
- X系列:這些型號具有更高的頻率和更大的L3快取,例如Epyc 7773X、Epyc 7573X和Epyc 7373X。
- F系列:這些型號具有更高的頻率和更小的L3快取,例如Epyc 75F3、Epyc 74F3和Epyc 73F3。
- P系列:這些型號具有相同的規格,但僅適用於單處理器配置,例如Epyc 7713P、Epyc 7543P和Epyc 7313P。
這些型號的價格從913美元(Epyc 7313P)到8,800美元(Epyc 7773X)不等,取決於它們的規格和效能。
Epyc 7003系列的完整23個CPU產品線。由於AMD使用了模組化的設計方法,透過Infinity Fabric將CCD(核心複合體)連線在一起,因此可以建立出幾乎無窮無盡的核心、TDP(功耗)、快取和頻率組合。AMD充分利用了這一點,推出了針對特定環境的最佳化SKU(產品型號)。
最明顯的例子是Epyc 72F3,它使用了與頂級7773X相同的8-CCD佈局,但每個CCD中只有一個核心處於活動狀態,而7773X可以同時執行所有八個核心。想想看,72F3的核心每個有32MB的L3快取,而7453(28個核心和64MB快取)則有2.29MB的L3快取每個核心。這種組合看起來很奇怪吧?
四個Epyc晶片具有相同的規格,但帶有一個P字尾,這意味著它們只能作為單個處理器使用。其他晶片可以在主機板上安裝成對,稱為2P配置,因此需要支付溢價。
細心的讀者會注意到四個帶有X字尾的晶片,這些晶片被稱為Milan-X,它們的L3快取是普通Epyc 7003處理器的三倍。AMD使用了一種稱為“3D V-Cache”的快取堆疊技術,我們已經詳細介紹過了。
擴大的L3快取對於各種技術計算工作負載非常有用,這些工作負載往往需要大量的記憶體,根據內部測試。這樣做可以顯著提高某些需要大量快取的應用程式的效能,但如果工作負載是計算密集型而不是快取密集型,那麼這種方法就變得毫無意義了。因此,需要謹慎選擇。
請注意,相同核心的處理器的建議價格差異很大。例如,16C32T Epyc 7313P的價格僅為913美元,而Epyc 7373X的價格為4185美元,或者說是前者的四倍以上。很明顯,AMD為更多的快取收取了高額的溢價,因為它知道依賴快取的客戶可以支付得起;財務支出遠遠超過了特定工作負載的效能提高。
同樣,核心、功耗預算和快取的組合決定了目標工作負載。AMD認為可以收取更多的費用時,它就會這樣做,特別是如果英特爾Xeon在該領域不是一個真正的競爭對手。例如,如果使用者需要高頻率的處理器,因為他們的工作負載是突發性的,那麼F系列就是為他們準備的……並且價格也相應地高。
AMD的Epyc 7003 SKU矩陣在每個處理器的背景下看起來很混亂。
這個基準測試很有趣。以前需要幾分鐘的時間,現在在標準的“defconfig”設定下,只需要不到20秒鐘。
(注:這裡的“defconfig”是指Linux核心的預設配置設定)