CPU內部的奧秘：程式碼是如何被執行的？

袋鼠雲數棧前端發表於2023-03-30

原文網址 : https://www.cnblogs.com/dtux/p/17274032.html

我們是袋鼠雲數棧 UED 團隊，致力於打造優秀的一站式資料中臺產品。我們始終保持工匠精神，探索前端道路，為社群積累並傳播經驗價值。

本文作者：景明

我們以一段 C 程式碼為例，來看一下程式碼被編譯成二進位制可執行程式之後，是如何被 CPU 執行的。

在這段程式碼中，只是做了非常簡單的加法操作，將 x 和 y 兩個數字相加得到 z，並返回結果 z。

int main() {
    int x = 1;
    int y = 2;
    int z = x + y;
    return z;
}

我們知道，CPU 並不能直接執行這段 C 程式碼，而是需要對其進行編譯，將其轉換為二進位制的機器碼，然後 CPU 才能按照順序執行編譯後的機器碼。

先透過 GCC 編譯器將這段 C 程式碼編譯成二進位制檔案，輸入以下命令讓其編譯成目的檔案：

gcc -O0 -o code_prog code.c

輸入上面的命令之後回車，在資料夾中生成名為 code_prog 的可執行程式，接下來再將編譯出來的 code_prog 程式進行反彙編，這樣就可以看到二進位制程式碼和對應的彙編程式碼。可以使用 objdump 的完成該任務，命令如下所示：

objdump -d code_prog

最後編譯出來的機器碼如下：

0000000100003f84 <_main>:
100003f84: ff 43 00 d1  	  sub	sp, sp, #16            // 開闢棧空間。即開闢了四個 4 位元組空間
100003f88: ff 0f 00 b9  	  str	wzr, [sp, #12]         // 將 wzr 暫存器的資料儲存到 sp 暫存器的 #12 地址上，設為0
100003f8c: 28 00 80 52  	  mov	w8, #1                 // 建立一個 x = 1，並將 1 存入 w8 暫存器中
100003f90: e8 0b 00 b9  	  str	w8, [sp, #8]           // 將 w8 暫存器的資料存入 sp 暫存器中 #8 的地址中，也就是將 x = 1 存入
100003f94: 48 00 80 52  	  mov	w8, #2                 // 建立一個 y = 2，並將 2 存入 w8 暫存器中
100003f98: e8 07 00 b9  	  str	w8, [sp, #4]           // 將 w8 暫存器的資料存入 sp 暫存器中 #4 的地址中，也就是將 y = 2 存入
100003f9c: e8 0b 40 b9  	  ldr	w8, [sp, #8]           // 讀取 sp 暫存器中 #8 的資料存入 w8 暫存器中，也就是獲取 x = 1
100003fa0: e9 07 40 b9  	  ldr	w9, [sp, #4]           // 讀取 sp 暫存器中 #4 的資料存入 w9 暫存器中，也就是獲取 y = 2
100003fa4: 08 01 09 0b  	  add	w8, w8, w9             // 將 w8、w9 暫存器的 x,y 資料進行相加，並存入 w8 暫存器中，也就是 z = 3
100003fa8: e8 03 00 b9  	  str	w8, [sp]               // 將 w8 暫存器的資料存入 sp 暫存器中
100003fac: e0 03 40 b9  	  ldr	w0, [sp]               // 讀取 sp 暫存器中的資料存到 w0 暫存器中。z = 3
100003fb0: ff 43 00 91  	  add	sp, sp, #16            // 清空開闢的棧空間
100003fb4: c0 03 5f d6  	  ret                        // 返回結果

PS: wzr 為 32 的零暫存器，專門用來清零，也就是 sp 上 #12 指向的資料設定為 0

觀察上方，左邊就是編譯生成的機器碼，在這裡它是使用十六進位制來展示的，這主要是因為十六進位制比較容易閱讀，所以通常使用十六進位制來展示二進位制程式碼。

可以觀察到上圖是由很多行組成的，每一行都是一個指令，該指令可以讓 CPU 執行指定的任務。

中間的部分是彙編程式碼，例如原本是二進位制表示的指令，在彙編程式碼中可以使用單詞來表示，比如 mov、add 就分別表示資料的儲存和相加。

通常將組合語言編寫的程式轉換為機器語言的過程稱為“彙編”；反之，機器語言轉化為組合語言的過程稱為“反彙編”，比如上圖就是對 code_prog 程式進行了反彙編操作。

右邊新增的註釋，表示每條指令的具體含義。

這一大堆指令按照順序集合在一起就組成了程式，所以程式的執行，本質上就是 CPU 按照順序執行這一大堆指令的過程。

CPU 是怎麼執行程式的？

為了更好的分析程式的執行過程，我們還需要了解一下基礎的計算機硬體資訊，具體如下圖：

file

這張圖是比較通用的系統硬體組織模型圖，它主要是由 CPU、主儲存器、各種 IO 匯流排，還有一些外部裝置組成的。

首先，在一個程式執行之前，程式需要被裝進記憶體，比如在 macOS 下面，你可以透過滑鼠點選一個可執行檔案，當你點選該檔案的時候，系統中的程式載入器會將該檔案載入到記憶體中。

CPU 可以透過指定記憶體地址，從記憶體中讀取資料，或者往記憶體中寫入資料，有了記憶體地址，CPU 和記憶體就可以有序地互動。

記憶體中的每個儲存空間都有其對應的獨一無二的地址：

file

在記憶體中，每個存放位元組的空間都有其唯一的地址，而且地址是按照順序排放的。

以開頭程式碼為例，這段程式碼會被編譯成可執行檔案，可執行檔案中包含了二進位制的機器碼，當二進位制程式碼被載入進了記憶體後，那麼記憶體中的每條二進位制程式碼便都有了自己對應的地址，如下圖所示：

file

一旦二進位制程式碼被裝載進記憶體，CPU 便可以從記憶體中取出一條指令，然後分析該指令，最後執行該指令。

把取出指令、分析指令、執行指令這三個過程稱為一個 CPU 時鐘週期。CPU 是永不停歇的，當它執行完成一條指令之後，會立即從記憶體中取出下一條指令，接著分析該指令，執行該指令，CPU 一直重複執行該過程，直至所有的指令執行完成。

CPU 是怎麼知道要取出記憶體中的哪條指令呢？：

file

從上圖可以看到 CPU 中有一個 PC 暫存器，它儲存了將要執行的指令地址，當二進位制程式碼被裝載進了記憶體之後，系統會將二進位制程式碼中的第一條指令的地址寫入到 PC 暫存器中，到了下一個時鐘週期時，CPU 便會根據 PC 暫存器中的地址，從記憶體中取出指令。

PC 暫存器中的指令取出來之後，系統要做兩件事：第一件是將下一條指令的地址更新到 PC 暫存器中，如下圖所示：

file

更新了 PC 暫存器之後，CPU 就會立即做第二件事，那就是分析該指令，並識別出不同的型別的指令，以及各種獲取運算元的方法。

在指令分析完成之後，就要執行指令了。

在執行指令前，我們還需要認識一下 CPU 中的重要部件：暫存器。

暫存器

暫存器是 CPU 中用來存放資料的裝置，不同處理器中暫存器的個數也是不一樣的，之所要暫存器，是因為 CPU 訪問記憶體的速度很慢，所以 CPU 就在內部新增了一些儲存裝置，這些裝置就是暫存器。

他們的讀取速度如下：

file

總結來說，暫存器容量小，讀寫速度快，記憶體容量大，讀寫速度慢。

暫存器通常用來存放資料或者記憶體中某塊資料的地址，我們把這個地址又稱為指標，通常情況下暫存器對存放的資料是沒有特別的限制的，比如某個通用暫存器既可以儲存資料，也可以儲存指標。

不過由於歷史原因，我們還會將某些專用的資料或者指標儲存在專用的通用暫存器中，比如 rbp 暫存器通常用來存放棧幀指標的，rsp 暫存器用來存放棧頂指標的，PC 暫存器用來存放下一條要執行的指令等。

特殊暫存器

Stack Pointer register（SP）

The use of SP as an operand in an instruction, indicates the use of the current stack pointer.
指向當前棧指標。堆疊指標總是指向棧頂位置。一般堆疊的棧底不能動，所以資料入棧前要先修改堆疊指標，使它指向新的空餘空間然後再把資料存進去，出棧的時候相反。

堆疊指標，隨時跟蹤棧頂地址，按"先進後出"的原則存取資料。

Link Register （LR）

連線暫存器，一是用來儲存子程式返回地址；二是當異常發生時，LR中儲存的值等於異常發生時PC的值減4（或者減2），因此在各種異常模式下可以根據LR的值返回到異常發生前的相應位置繼續執行。

Program Counter（PC）

A 64-bit Program Counter holding the address of the current instruction.
儲存了將要執行的指令地址

Word Zero Register（WZR）

零暫存器，用於給int清零

tips

不同指令中暫存器後 #d 有什麼區別？
[#d]在ARM代表的是一個常數表示式。
如：#0x3FC、#0、#0xF0000000、#200、#0xF0000001
都是代表著一個常數。

在 sp 暫存器中，代表的是當前棧頂指標移動的位置。
如：

sub	sp, sp, #16；// 獲取 sp 中的棧頂指標移動 16位的位置，並把位置更新到 sp 暫存器中。實現開闢空間

在通用暫存器 W0 - W11 中，代表的操作的常數值。

mov	w8, #2，// 把常數 2 新增到 w8 暫存器中

通用暫存器

以下介紹下比較常見的通用暫存器：

其中W0~W3 用於函式呼叫入參，其中，W0 還用於程式的返回值.
W4~W11用於儲存區域性變數。
W13為SP，時刻指向棧頂，當有資料入棧或出棧時，需要更新SP
W14為連結暫存器，主要是用作儲存子程式返回的地址。
W15為PC暫存器，指向將要執行的下一條指令地址。

常見指令

mov

資料傳送指令。將立即數或暫存器(operant2)傳送到目標暫存器Rd，可用於移位運算等操作。指令格式如下：

MOV{cond}{S} Rd,operand2

如:

mov w8, #1，就是往 w8 暫存器中寫入 #1.

mov w8, w9，就是把 w9 暫存器的資料傳送到 w8 暫存器中，最終 w8 和 w9 暫存器的資料一致。如下圖：

file

ldr

ldr 從記憶體中讀取資料放入暫存器中

LDR{cond}{T} Rd,<地址>;載入指定地址上的資料(字)，放入Rd中

如：

ldr w8, [sp, #8] 讀取 sp 暫存器中 #8 位置的資料存入 w8 暫存器中，改變的只有 w8 ，sp 暫存器不變

str

str 指令用於將暫存器中的資料儲存到記憶體

STR{cond}{T} Rd,<地址>;儲存資料(字)到指定地址的儲存單元，要儲存的資料在Rd中

如：
str w8, [sp] ，將 w8 暫存器的資料存入 sp 暫存器中

add

加法運算指令。將operand2 資料與Rn 的值相加，結果儲存到Rd 暫存器。指令格式如下：

ADD{cond}{S} Rd,Rn,operand2

以 add w8, w8, w9 為例，就是把 w8、w9 暫存器的 x,y 資料進行相加，並存入 w8 暫存器中

如下圖：

file

sub

減法運算指令。用暫存器 Rn 減去operand2。結果儲存到 Rd 中。指令格式如下：

SUB{cond}{S} Rd,Rn,operand2

如：

sub R0,R0,#1 -- R0=R0-1

執行過程

瞭解了以上的知識，我們再來分析一遍程式碼的執行過程。

在 C 程式中，CPU 會首先執行呼叫 main 函式，在呼叫 main 函式時，生成一塊記憶體空間，用來存放 main 函式執行過程中的資料。

sub	sp, sp, #16

將 0 寫入到 #12 的位元組位置上。

str	wzr, [sp, #12]

接下來給 x 附值

mov	w8, #1
str	w8, [sp, #8]

第一行指令是把 1 新增進暫存器中。第二行指令是把 1 存入 #8 地址的記憶體空間中。

接著給 y 附值

mov	w8, #2
str	w8, [sp, #4]

第一行指令是把 2 新增進暫存器中。第二行指令是把 2 存入 #4 地址的記憶體空間中。

執行完 x， y 的生成，接下來執行 z = x + y

ldr	w8, [sp, #8]
ldr	w9, [sp, #4]
add	w8, w8, w9

第一行指令取出記憶體空間地址為 #8 的資料，也就是 1. 第二行指令去除記憶體空間地址為 #4 的資料，也就是 2，第三行指令則對取出的資料進行相加操作，並將結果 3 存入暫存器中。

str	w8, [sp]
ldr	w0, [sp]

第一行指令把暫存器中的最終的資料存入記憶體中，第二行指令則獲取記憶體中的結果，存入暫存器中。等待返回

add	sp, sp, #16

把開闢的空間進行清理。

ret

返回結果

總結

本文主要講解了 CPU 的執行過程，順便了解了一下基礎的計算機硬體資訊，如有想法?歡迎討論！！！

參考

-《圖解 Google V8》- 李兵

多執行緒程式是如何執行程式碼的？
2023-10-27
執行緒行程
Java Main 如何是如何被執行的？
2021-09-09
JavaAI
java類內部程式碼執行順序
2022-12-05
Java
執行緒繫結cpu核心的程式碼研究
2024-10-31
執行緒
揭秘計算機指令執行的神秘過程：CPU內部的絕密操作
2023-10-21
計算機
程式碼是怎麼執行的？
2021-11-15
Linux 從頭學 01：CPU 是如何執行一條指令的？
2021-07-02
Linux
Java併發Map的面試指南：執行緒安全資料結構的奧秘
2023-09-21
Java面試執行緒資料結構
探索古英語的奧秘：一部語言的時光機
2024-12-01
靜態內部類實現的單例模式是執行緒安全的
2021-04-18
單例模式執行緒
對多執行緒程式，單核cpu與多核cpu如何工作相關的探討
2019-01-19
執行緒單核
‘cnpm' 不是內部或外部命令,也不是可執行的程式
2019-03-18
NPM
SQL是如何執行的
2020-09-23
SQL
Duolingo 的內部測試是如何運作的
2024-03-28
Go
密碼是如何被竊取的
2018-12-18
密碼
V8是怎麼執行JS程式碼的
2022-04-01
JS
c++是如何執行的
2024-03-31
C++
sql更新是如何執行的？
2019-04-26
SQL
JVM調優jstack找出最耗cpu的執行緒&定位問題程式碼
2020-11-19
JVMJS執行緒
如何檢視CPU核數和執行緒數？CPU的核心數、執行緒數的關係和區別
2019-08-13
執行緒
pytorch中’tensorboard‘不是內部或外部命令，也不是可執行的程式
2020-11-11
PyTorchORB
匿名內部類方式實現執行緒的建立
2020-11-13
執行緒
[原始碼解析]Oozie來龍去脈之內部執行
2020-07-08
原始碼
譯—JavaScript是如何工作的（2）：V8引擎內部+優化程式碼的5個技巧
2019-03-25
JavaScript優化
執行緒池中多餘的執行緒是如何回收的？
2020-10-31
執行緒
關於程式碼如何執行的五個問題
2023-12-25
核心是如何給容器中的程式分配CPU資源的？
2023-03-16
conda不是內部或外部命令，也不是可執行的程式解決方案
2020-12-16
sql查詢是如何執行的？
2019-04-26
SQL
17.Sql是如何執行的
2024-10-28
SQL
爬蟲代理是如何執行的？
2022-06-09
爬蟲
Python是如何編譯執行的
2021-09-11
Python編譯
如何用iPad執行Python程式碼？
2018-06-27
iPadPython
探索色彩搭配的奧秘：如何選擇適合產品的理想配色方案
2024-03-01
Java程式碼質量改進之：使用ThreadLocal維護執行緒內部變數
2018-08-04
Javathread執行緒變數
單執行緒的js是如何工作的
2019-02-28
執行緒JS
JavaScript的程式碼執行機制
2019-09-16
JavaScript
PHP 互斥鎖：如何確保程式碼的執行緒安全？
2024-11-27
PHP執行緒

CPU內部的奧秘：程式碼是如何被執行的？

CPU 是怎麼執行程式的？

暫存器

特殊暫存器

Stack Pointer register（SP）

Link Register （LR）

Program Counter（PC）

Word Zero Register（WZR）

tips

通用暫存器

常見指令

mov

ldr

str

add

sub

執行過程

總結

參考

相關文章