以arm64為例
xcode除錯彙編
1. xcode 檢視執行時的彙編程式碼
debug -> debug workflow -> always show
disassembly
2. Xcode改變pc值
register write pc 0x1005d6928
3. 單步執行一步彙編程式碼:ni
4. 讀取某個暫存器
(lldb) register read x0
x0 = 0x0000000000000000
(lldb)
複製程式碼
5. 進入某個彙編函式
按住control+Xcode的下箭頭鍵
6. 新建彙編檔案或內嵌彙編程式碼
新建:command+N 然後選擇assembly file 內嵌:
int main(int argc, char * argv[]) {
asm(
"mov w0,#0x0\n"
"adds w0,w0,#0x1\n"
);
return 0;
}
複製程式碼
一 通用暫存器
- ARM64擁有有31個64位的通用暫存器 x0 到 x30,這些暫存器通常用來存放一般性的資料,稱為通用暫存器(有時也有特定用途)
- 那麼w0 到 w28 這些是32位的. 因為64位CPU可以相容32位.所以可以只使用64位暫存器的低32位.
- 比如 w0 就是 x0的低32位! ######Xcode檢視暫存器:
- 通常,CPU會先將記憶體中的資料儲存到通用暫存器中,然後再對通用暫存器中的資料進行運算。
- 假設記憶體中有塊紅色記憶體空間的值是3,現在想把它的值加1,並將結果儲存到藍色記憶體空間
- CPU首先會將紅色記憶體空間的值放到X0暫存器中:mov X0,紅色記憶體空間
- 然後讓X0暫存器與1相加:add X0,1
- 最後將值賦值給記憶體空間:mov 藍色記憶體空間,X0
二 pc暫存器(program counter)
- 為指令指標暫存器,它指示了CPU當前要讀取指令的地址
- 在記憶體或者磁碟上,指令和資料沒有任何區別,都是二進位制資訊
- CPU在工作的時候把有的資訊看做指令,有的資訊看做資料,為同樣的資訊賦予了不同的意義
- 比如 1110 0000 0000 0011 0000 1000 1010 1010
- 可以當做資料 0xE003008AA
- 也可以當做指令 mov x0, x8
- CPU根據什麼將記憶體中的資訊看做指令?
- CPU將pc指向的記憶體單元的內容看做指令
- 如果記憶體中的某段內容曾被CPU執行過,那麼它所在的記憶體單元必然被pc指向過
三 bl指令
ARM64提供了另外的指令來修改PC的值,這些指令統稱為轉移指令,最簡單的是bl指令。
- CPU從何處執行指令是由pc中的內容決定的,我們可以通過改變pc的內容來控制CPU執行目標指令
- ARM64提供了一個mov指令(傳送指令),可以用來修改大部分暫存器的值,比如
mov x0,#10、mov x1,#20
- ARM64提供bl指令來修改PC的值
四 資料地址暫存器
資料地址暫存器通常用來做資料計算的臨時儲存、做累加、計數、地址儲存等功能。定義這些暫存器的作用主要是用於在CPU指令中儲存運算元,在CPU中當做一些常規變數來使用。 ARM64中
- 64位: X0-X30, XZR(零暫存器)
- 32位: W0-W30, WZR(零暫存器)
注意: 之前講解8086彙編中有一種特殊的暫存器段暫存器:CS,DS,SS,ES四個暫存器來儲存這些段的基地址,這個屬於Intel架構CPU中.在ARM中並沒有
五 浮點和向量暫存器
因為浮點數的儲存以及其運算的特殊性,CPU中專門提供浮點數暫存器來處理浮點數
- 浮點暫存器 64位: D0 - D31 32位: S0 - S31
現在的CPU支援向量運算.(向量運算在圖形處理相關的領域用得非常的多)為了支援向量計算系統了也提供了眾多的向量暫存器.
- 向量暫存器 128位:V0-V31
六 一些特殊暫存器
1. 引數:x0 -- x7(個數有關係、資料型別也有關,比如浮點暫存器等)多餘的就會入棧
2. lr(x30)儲存下一條指令地址,bl會跳轉到x30指向的地址去執行程式碼
3. sp暫存器:sp拉伸棧空間(16的倍數)
4. fp暫存器也稱為x29暫存器屬於通用暫存器,但是在某些時刻我們利用它儲存棧底的地址!()
注意:ARM64開始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp str\stp
4. ret 返回到lr暫存器所儲存的地址 執行程式碼,返回值儲存到x0中
七 CPSR(current program status register)狀態暫存器
CPSR和其他暫存器不一樣,其他暫存器是用來存放資料的,都是整個暫存器具有一個含義.而CPSR暫存器是按位起作用的,也就是說,它的每一位都有專門的含義,記錄特定的資訊.
注:CPSR暫存器是32位的
- CPSR的低8位(包括I、F、T和M[4:0])稱為控制位,程式無法修改,除非CPU執行於特權模式下,程式才能修改控制位!
- N、Z、C、V均為條件碼標誌位。它們的內容可被算術或邏輯運算的結果所改變,並且可以決定某條指令是否被執行
1. N(Negative)標誌
N,符號標誌位。 它記錄相關指令執行後,其結果是為負 N = 1,如果是非負數 N = 0.
注意,在ARM64的指令集中,有的指令的執行時影響狀態暫存器的,比如add\sub\or等,他們大都是運算指令(進行邏輯或算數運算);
2. Z(Zero)標誌
Z,0標誌位。 它記錄相關指令執行後,其結果是為0. 那麼Z = 1.如果結果不為0,那麼Z = 0.
3. C(Carry)標誌
C,進位標誌位。[圖片上傳中...(15201651736312.jpg-68cfc1-1524662058998-0)] 一般情況下,進行無符號數的運算。 加法運算:當運算結果產生了進位時(無符號數溢位),C=1,否則C=0。 減法運算(包括CMP):當運算時產生了借位時(無符號數溢位),C=0,否則C=1。
對於位數為N的無符號數來說,其對應的二進位制資訊的最高位,即第N - 1位,就是它的最高有效位,而假想存在的第N位,就是相對於最高有效位的更高位。如下圖所示:
進位
我們知道,當兩個資料相加的時候,有可能產生從最高有效位向更高位的進位。比如兩個32位資料:0xaaaaaaaa + 0xaaaaaaaa,將產生進位。由於這個進位值在32位中無法儲存,我們就只是簡單的說這個進位值丟失了。其實CPU在運算的時候,並不丟棄這個進位制,而是記錄在一個特殊的暫存器的某一位上。ARM下就用C位來記錄這個進位值。比如,下面的指令
mov w0,#0xaaaaaaaa;0xa 的二進位制是 1010
adds w0,w0,w0; 執行後 相當於 1010 << 1 進位1(無符號溢位) 所以C標記 為 1
adds w0,w0,w0; 執行後 相當於 0101 << 1 進位0(無符號沒溢位) 所以C標記 為 0
adds w0,w0,w0; 重複上面操作
adds w0,w0,w0
複製程式碼
借位
當兩個資料做減法的時候,有可能向更高位借位。再比如,兩個32位資料:0x00000000 - 0x000000ff,將產生借位,借位後,相當於計算0x100000000 - 0x000000ff。得到0xffffff01 這個值。由於借了一位,所以C位 用來標記借位。C = 0.比如下面指令:
mov w0,#0x0
subs w0,w0,#0xff ;
subs w0,w0,#0xff
subs w0,w0,#0xff
複製程式碼
4. V(Overflow)溢位標誌
CPSR的第28位是V,溢位標誌位。在進行有符號數運算的時候,如果超過了機器所能標識的範圍,稱為溢位。
- 正數 + 正數 為負數 溢位
- 負數 + 負數 為正數 溢位
- 正數 + 負數 不可能溢位
八 函式的本質
函式的本質就是函式呼叫棧,只要呼叫函式,就會開闢棧空間。發生函式呼叫時,sp拉伸棧空間,函式的引數是存放在X0到X7(W0到W7)這8個暫存器裡面的.如果超過8個引數,就會入棧,區域性變數也入棧,x29和x30也要入棧以便bl跳轉回來能找到下一條指令繼續執行,如果是葉子函式,則不用儲存x29和x30。函式的返回值是放在X0 暫存器裡面的。所以拉伸棧空間的大小和引數,區域性變數以及x29和x30有關。
1. 棧:是一種具有特殊的訪問方式的儲存空間(後進先出, Last In Out Firt,LIFO)
sp暫存器在任意時刻會儲存我們棧頂的地址,fp暫存器也稱為x29暫存器屬於通用暫存器,但是在某些時刻我們利用它儲存棧底的地址!2. 記憶體讀寫指令
注意:讀/寫 資料是都是往高地址讀/寫
str(store register)指令 將資料從暫存器中讀出來,存到記憶體中. ldr(load register)指令 將資料從記憶體中讀出來,存到暫存器中 此ldr 和 str 的變種ldp 和 stp 還可以操作2個暫存器.
使用32個位元組空間作為這段程式的棧空間,然後利用棧將x0和x1的值進行交換.程式碼如下:
sub sp, sp, #0x20 ;拉伸棧空間32個位元組
stp x0, x1, [sp, #0x10] ;sp往上加16個位元組,存放x0 和 x1
ldp x1, x0, [sp, #0x10] ;將sp偏移16個位元組的值取出來,放入x1 和 x0
複製程式碼