[轉帖]晶片相關-- Cpu歷史--AMD系列

济南小老虎發表於2024-04-02
晶片相關-- Cpu歷史--AMD系列
https://zhuanlan.zhihu.com/p/477864185

1.1 AMD

1968 年,快捷半導體的8位創始人中的兩位——總經理羅伯特·諾伊斯(Robert Noyce)和實驗室負責人戈登·摩爾(Gorden Moore),帶著一部分員工離開了陷入資金危機的公司,成立了英特爾(Intel)。而一年後的 1969 年5月1日,桑德斯(之前在摩托羅拉,後來去了快捷半導體Fairchild Semiconductor)也帶著 7 個人另立門戶,成立了超微半導體(Advanced Micro Devices, AMD)。

AMD當前處理器分為:伺服器霄龍cpu,工作站銳龍執行緒撕裂者和銳龍pro cpu,嵌入式霄龍,銳龍,R和G繫系列嵌入式cpu,筆記本銳龍pro,銳龍和速龍移動cpu,臺式處理器銳龍執行緒撕裂者,銳龍pro,速龍pro,銳龍及搭載顯示卡的cpu,以及支援chromebook處理器系列

Ø 伺服器處理器AMD EPYC(霄龍):先進的 x86 伺服器處理器4樹立卓越效能、安全和可擴充套件性新標準。

Ø 工作站處理器AMD 銳龍 Threadripper PRO,銳龍Threadripper,銳龍PRO:藉助擁有超多核心的高效能工作站處理器,輕鬆應對多執行緒工作負載。

Ø 嵌入式和半定製處理器AMD EPYC(霄龍)嵌入式,AMD 銳龍嵌入式處理器,R和G系列嵌入式解決方案和半定製。

Ø 膝上型電腦處理器面向企業的 AMD 銳龍 PRO 移動處理器:出色的多核效能和超長電池續航 + 優秀的可管理性和額外安全保護。面向企業的 AMD 銳龍移動處理器:疾速響應、多核效能、卓越能效和超長電池續航。AMD 銳龍移動處理器:超多核心為移動處理器帶來卓越效能。AMD 速龍移動處理器:面向主流膝上型電腦打造卓越效能和先進功能。面向學生和老師的 AMD 膝上型電腦:AMD 處理器搭載 Radeon 顯示卡,帶來疾速順暢的網頁瀏覽和影片播放體驗,為線上學習環境賦能助力。

Ø 臺式處理器

l AMD 銳龍 Threadripper PRO 處理器:7nm 製程工藝打造出色的 CPU 核心密度,並且支援 128 條 PCIe® 4.0 通道,輕鬆應對各種專業工作負載。

l AMD 銳龍 PRO 處理器:最多可達8個核心,帶來出色的效能、先進的安全功能和無縫的可管理性,輕鬆應對各種嚴苛業務環境。

l AMD 速龍 PRO 處理器:專業的安全功能、效能和可管理性,以及卓越的價值。

l AMD 銳龍 Threadripper 處理器助力高階桌上型電腦:最多可達 64 核心和 128 執行緒,讓創意工作疾速非凡。

l AMD 銳龍處理器:最多可達 16 核心和 32 執行緒,最高可達 4.9GHz 的加速時脈頻率和最多可達 72MB 的快取記憶體,實力打造非凡卓越的效能。

l AMD 銳龍處理器搭載 Radeon 顯示卡:無需獨立顯示卡,即可享受發燒級效能。

l AMD 速龍處理器搭載 Radeon 顯示卡:最多可達 4 個先進的“Zen +”3 處理核心和 4 個處理執行緒,輕鬆疾速搞定日常辦公、網上衝浪和多工處理。

Chromebook 處理器:

l 面向企業的 AMD Chromebook:效能卓越的 AMD 銳龍和速龍處理器為 Chrome 裝置賦能,全面加速企業雲端計算應用。

l 面向家庭和個人的AMD Chromebook:AMD處理器出色的能效助力打造更輕更薄的 Chromebook,帶來超快的連線以及超長的電池續航。

l 面向學生和老師的 AMD Chromebook:Chromebook 助力使用者透過各種多媒體應用、STEM 工具、安全功能和精彩創意,深度融入現代教育的方方面面。

1.1.1 K5

K5是AMD公司1993年開始開發,並於1996年03月27日釋出的第一個獨立生產的x86級CPU,之前都是跟隨intel,例如逆向8080,釋出AM9080。當時為了和zilog Z80對抗,1976年和intel簽訂協議,作為intel的第二供應商,類似代工廠。後面各種巧合,intel給amd授權,AMD也走價效比路線,1985intel撕毀協定,停止了32位處理器80386的授權,AMD告intel,持續四年多,最後勝訴一直追隨不是辦法。

[轉帖]晶片相關-- Cpu歷史--AMD系列
圖1 AMD代工的8088和逆向的386[轉帖]晶片相關-- Cpu歷史--AMD系列

K5系列: K5系列CPU的頻率共有6種: 75 MHz/90 MHz /100 MHz /120 MHz/133 MHz /166 MHz,匯流排的頻率和Pentium差不多,都是60 MHz或者66 MHz。K5採用了高度並行化的 29k RISC 指令集,這與主流的 CISC 指令集大相徑庭,但又提供了非常好的 x86 前端。其內部則採用了 4 流水線、5 個整數單元和 1 個浮點單元的設計。為了保證相容性,K5 能夠在奔騰的 Socket 5/7 系列主機板上使用。

K5系列 CPU都內建了32 KB的一級快取,Pentium內建的16 KB,在整數運算和系統整體效能方面要比同樣時脈頻率的Pentium還要好,但K5上市時間比Pentium(93年3月釋出)晚了許多,再加上浮點運算能力遠遠比不上Pentium,一度使得AMD的市場份額大量喪失。

[轉帖]晶片相關-- Cpu歷史--AMD系列
圖2 AMD K5 CPU

K5 的競爭對手是 Intel 的奔騰 Pro 系列(於 1995 年釋出)和 Cyrix 的 6x86 系列。整數運算效能大約是奔騰 200 的水平,浮點效能則是奔騰 100 的水平,但擊敗了 Cyrix 的競品(當時購買的就是cyrix 200的cpu),還是比較中規中矩的,由於出的較晚,第一次嘗試效果一般。

1.1.2 K6-2

矽谷有個60 人的小公司 NexGen,研發的Nx686 處理器輕鬆地達到了 180MHz 的核心頻率,透過比爾蓋茲的撮合, 與NexGen的創始人Atiq Raza(“微處理器設計領域的邁克爾·喬丹”)建立合作關係,將Nx686 CPU 技術用在K6上,可以直接插在socket7主機板上,效能和intel pentun II有一拼,成為公司的轉折點。

[轉帖]晶片相關-- Cpu歷史--AMD系列
圖3 AMD K6-2 CPU

1.1.3 K7速龍

1999年6月,AMD推出的K7架構處理器比K6更加強勢,其主要技術來自DEC公司強大的伺服器處理器Alpha 21264,並使用了Alpha架構的EV6匯流排。與之前的絕大部分非Intel處理器不同,K7架構擁有超越Intel處理器的浮點能力和頻率潛力。首款K7處理器被命名為Athlon至今仍是中低端處理器的品牌。

[轉帖]晶片相關-- Cpu歷史--AMD系列
[轉帖]晶片相關-- Cpu歷史--AMD系列
圖4 Socket A介面Thunderbird(雷鳥)核心Athlon處理器低端的Duron(鑽龍,俗稱毒龍)

2001年底,AMD在壓力下也推出了新版本的K7處理器進行應對,即Athlon XP,其主要變化是加入了對SSE指令集的支援,以及更高的頻率,另外相應的晶片組也開始支援更高頻寬的DDR記憶體,封裝基板也從厚重的陶瓷改為了更輕巧、類似Pentium Ⅲ的樹脂材質。

[轉帖]晶片相關-- Cpu歷史--AMD系列
圖5 樹脂基板的Athlon

這種裸die封裝方式,出現過散熱器壓碎cpu die的情況,後來封裝都加上了一個金屬外殼保護die,但感覺上還是少了些生趣。是不是對安裝cpu散熱器心有餘悸,安裝起來怎麼彆扭怎麼來,劃傷手都是正常的。但是的散熱器魚龍混雜,沒有標準的散熱器夾具,有沒有裝散熱器很不順手的情況,

1.1.4 K8皓龍

2003年8月,AMD推出的K8處理器可以說是一款劃時代的產品。基於K7但是又三項改變:

加入了64位指令集,其實64位指令集是intel先提出的並且用在IA64架構安騰(Itanium)處理器上,後來也被迫在消費cpu上也支援64位。

首次整合了記憶體控制器,最初支援DDR記憶體,可以大幅度降低記憶體與處理器的通訊延遲,提升系統整體效能

放棄了原有的FSB前端匯流排而採用了HyperTransport匯流排技術,它採用點對點序列設計,讓記憶體、磁碟、PCI匯流排控制器之間有了更高的資料頻寬和更大的彈性空間。

除此之外,K8還在K7架構的基礎上還加長了整數與浮點流水線,增加了快取容量,加入溫控電路和節能技術,以及增加了對SSE2指令集的支援。第一代K8處理器架構內建單/雙通道DDR400記憶體控制器,一級快取為128KB,二級快取為512KB~1024KB。封裝上和奔騰4類似加入了金屬保護殼,防止壓碎。

K8處理器有面向主流市場的Athlon 64、頂級的Athlon 64 FX以及專業級產品Opteron,介面也分為Socket 754和Socket 940兩種。

[轉帖]晶片相關-- Cpu歷史--AMD系列
圖6 兩種封裝,後者支援雙通道記憶體

2006年第一季度,AMD處理器10年的繁榮期達到頂峰,在X86市場的份額達到近50%,Intel Pentium 4最終完敗。不過此時,筆記本平臺上的Intel Pentium M處理器卻大獲成功。成功往往伴隨對手失誤。

Tips:2001 年 8 月,Intel 的基於 NetBurst 架構的奔騰 4 系列開始鋪貨,首批型號代號為 Willamette,頻率來到了史無前例的 2GHz。NetBurst 架構的宗旨是採用較長的流水線,透過幾乎是暴力提升頻率的簡單方法來達到提升效能的效果。2005 年 5 月,這次是 Intel,搶先發布了史上第一款雙核 CPU:奔騰 D。不過,奔騰 D 是由兩顆 P4 的核心共享 FSB 組成,本質上還是沒有擺脫高功耗低效能的怪圈。一週以後,AMD 就祭出了自己的雙核心處理器:Athlon 64 X2,代號 Toledo/Manchester,製程為 90nm, 吊打了奔騰 D。

1.1.5 AMD Zen

2006年,收購加拿大的顯示卡企業ATI,從此一蹶不振,後來集中精力遊戲主機的關注和新架構ZEN的開發,當前市場上有三大遊戲主機,微軟Xbox,索尼PlayStation和任天堂Wii都是用AMD處理器。

距K8後的下一次翻身就是zen架構。

Zen的L1快取在大小和關聯性都翻倍了,而且是寫回式而不是穿透式。同時採用了非對稱 L/S 單元,因為在大多數情況下 load 操作比 store 要頻繁得多。指令快取不再是兩個核心共享,同時關聯性也翻倍,這將減少快取未命中的情況。

1.1.6 AMD Zen2

“Zen 2”核心在久負盛名的“Zen”架構之上進行了重大更新。主要優勢如下:

時鐘週期指令數提升高達 15%2

3 級快取記憶體容量翻倍(高達 32MB)

浮點吞吐能力翻倍(256 位)

OpCache 容量翻倍(4K)

Infinity Fabric 頻寬翻倍(512 位)

全新的 TAGE 分支預測器

1.1.7 AMD Zen3

Hot Chips 2021大會上AMD釋出了Zen3架構處理器

一是提升單執行緒效能,專業名詞叫IPC(每時鐘週期指令數),畢竟之前幾代一直追求多核心為主,是時候把單核效能提升到足夠的高度了,不然始終是瘸著腳走路,缺乏長久競爭力。

二是在維持8核心CCD模組的前提下,統一核心與快取,提升彼此通訊效率,降低延遲。

三是繼續提高能效比,效能提升的同時功耗不能失控。

AMD Zen 3 CCD的尺寸為83.736mm2(11.270 x 7.430mm)。Zen 2 CCD約為72mm2,這使得Zen 3的尺寸比Zen 2大16%。12nmIOD(I/O Die)的尺寸與Ryzen 3000系列相同,為124.29mm2(12.900 x 9.635mm)並使其插入器上最大的晶片。

[轉帖]晶片相關-- Cpu歷史--AMD系列

為此,Zen3架構對於所有模組都進行了翻新,前端、預取、解碼、執行、整數、浮點、載入、儲存、快取等等,每個環節都是煥然一新。

首先,Zen3設計了一個堪稱藝術級的分支預測器,它之後有兩條通道將指令送入佇列,然後進行分派,一是8路關聯的32KB一級指令快取和x86解碼器,二是4K指令的操作快取(Op-cache)。

x86解碼器的限制是每個時鐘週期只能處理最多4條指令,但如果是熟悉的指令,就可以放入操作快取,每個週期就能處理8條,二者結合指令分發效率就大大提升,相比於Zen2直接上升了一個檔次。

指令分派之後就來到執行引擎階段,分為整數、浮點兩大部分,每個時鐘週期可以向它們分派6條指令。

其中,整數單元還是4個,但更加分散,並增加了一個單獨的分支與資料儲存單元,提升吞吐量,每時鐘週期可以生成3個地址。

浮點方面則分為六條流水線,進一步提升吞吐量和效率。

記憶體方面,每時鐘週期可以執行3個載入,或者1個載入加2個儲存,再次提升吞吐量,並且可以更靈活地處理不同工作負載。

[轉帖]晶片相關-- Cpu歷史--AMD系列
圖7 Zen2對比Zen3

前端方面,主要有容量翻番的L1 BTB、更大的分支預測器頻寬、更快的預測錯誤恢復、更快的操作快取拾取、更精細的操作快取流水線切換,等等。

執行引擎方面,主要有獨立的分支與資料儲存單元、更大的整數視窗、更低的特定整數/浮點指令延遲、6寬度拾取與分發、更寬的浮點分派、更快的浮點FMAC(乘法累加器),等等。

載入/儲存方面,主要有更高的載入頻寬(2個變3個)、更高的儲存頻寬(1個變2個)、更靈活的載入/儲存指令、更好的記憶體依賴檢測,等等。

世間本沒有魔法,只是我們還不瞭解,導致讓它看起來像有魔法一樣。

下期預告:

除了我們常見的Intel和amd外,另外在通用cpu舞臺上,還有哪些過客或目前在某些特殊領域依舊在發揮價值的公司和cpu種類。

上期回顧:

相關文章