Linux系統呼叫原理

fasionchan發表於2018-08-06

作業系統通過系統呼叫為執行於其上的程式提供服務。

當使用者態程式發起一個系統呼叫, CPU 將切換到 核心態 並開始執行一個 核心函式 。 核心函式負責響應應用程式的要求,例如操作檔案、進行網路通訊或者申請記憶體資源等。

原文地址:learn-linux.readthedocs.io

玩轉Linux舊群已滿,請加新群:278378501

歡迎關注我們的公眾號:小菜學程式設計 (coding-fan)

舉一個最簡單的例子,應用程式需要輸出一行文字,需要呼叫 write 這個系統呼叫:

#include <string.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
    char *msg = "Hello, world!\n";
    write(1, msg, strlen(msg));

    return 0;
}
複製程式碼

註解

讀者可能會有些疑問——輸出文字不是用 printf 等函式嗎?

確實是。 printf 是更高層次的庫函式,建立在系統呼叫之上,實現資料格式化等功能。 因此,本質上還是系統呼叫起決定性作用。

呼叫流程

那麼,在應用程式內,呼叫一個系統呼叫的流程是怎樣的呢?

我們以一個假設的系統呼叫 xyz 為例,介紹一次系統呼叫的所有環節。

系統呼叫流程圖

如上圖,系統呼叫執行的流程如下:

  1. 應用程式 程式碼呼叫系統呼叫( xyz ),該函式是一個包裝系統呼叫的 庫函式 ;
  2. 庫函式 ( xyz )負責準備向核心傳遞的引數,並觸發 軟中斷 以切換到核心;
  3. CPU 被 軟中斷 打斷後,執行 中斷處理函式 ,即 系統呼叫處理函式 ( system_call);
  4. 系統呼叫處理函式 呼叫 系統呼叫服務例程 ( sys_xyz ),真正開始處理該系統呼叫;

執行態切換

應用程式 ( application program )與 庫函式 ( libc )之間, 系統呼叫處理函式 ( system call handler )與 系統呼叫服務例程 ( system call service routine )之間, 均是普通函式呼叫,應該不難理解。 而 庫函式 與 系統呼叫處理函式 之間,由於涉及使用者態與核心態的切換,要複雜一些。

Linux 通過 軟中斷 實現從 使用者態 到 核心態 的切換。 使用者態 與 核心態 是獨立的執行流,因此在切換時,需要準備 執行棧 並儲存 暫存器 。

核心實現了很多不同的系統呼叫(提供不同功能),而 系統呼叫處理函式 只有一個。 因此,使用者程式必須傳遞一個引數用於區分,這便是 系統呼叫號 ( system call number )。 在 Linux 中, 系統呼叫號 一般通過 eax 暫存器 來傳遞。

總結起來, 執行態切換 過程如下:

  1. 應用程式 在 使用者態 準備好呼叫引數,執行 int 指令觸發 軟中斷 ,中斷號為 0x80 ;
  2. CPU 被軟中斷打斷後,執行對應的 中斷處理函式 ,這時便已進入 核心態 ;
  3. 系統呼叫處理函式 準備 核心執行棧 ,並儲存所有 暫存器 (一般用匯編語言實現);
  4. 系統呼叫處理函式 根據 系統呼叫號 呼叫對應的 C 函式—— 系統呼叫服務例程 ;
  5. 系統呼叫處理函式 準備 返回值 並從 核心棧 中恢復 暫存器 ;
  6. 系統呼叫處理函式 執行 ret 指令切換回 使用者態 ;

程式設計實踐

下面,通過一個簡單的程式,看看應用程式如何在 使用者態 準備引數並通過 int 指令觸發 軟中斷 以陷入 核心態 執行 系統呼叫 :

.section .rodata

msg:
    .ascii "Hello, world!\n"

.section .text

.global _start

_start:
    # call SYS_WRITE
    movl $4, %eax
    # push arguments
    movl $1, %ebx
    movl $msg, %ecx
    movl $14, %edx
    int $0x80

    # Call SYS_EXIT
    movl $1, %eax
    # push arguments
    movl $0, %ebx
    # initiate
    int $0x80
複製程式碼

這是一個組合語言程式,程式入口在 _start 標籤之後。

第 12 行,準備 系統呼叫號 :將常數 4 放進 暫存器 eax 。 系統呼叫號 4 代表 系統呼叫 SYS_write , 我們將通過該系統呼叫向標準輸出寫入一個字串。

第 14-16 行, 準備系統呼叫引數:第一個引數放進 暫存器 ebx ,第二個引數放進 ecx , 以此類推。

write 系統呼叫需要 3 個引數:

  • 檔案描述符 ,標準輸出檔案描述符為 1 ;
  • 寫入內容(緩衝區)地址;
  • 寫入內容長度(位元組數);

第 17 行,執行 int 指令觸發軟中斷 0x80 ,程式將陷入核心態並由核心執行系統呼叫。 系統呼叫執行完畢後,核心將負責切換回使用者態,應用程式繼續執行之後的指令( 從 20 行開始 )。

第 20-24 行,呼叫 exit 系統呼叫,以便退出程式。

註解

注意到,這裡必須顯式呼叫 exit 系統呼叫退出程式。 否則,程式將繼續往下執行,最終遇到 段錯誤segmentation fault )!

讀者可能很好奇——在寫 C 語言或者其他程式時,這個呼叫並不是必須的!

這是因為 C 庫( libc )已經幫你把髒活累活都幹了。

接下來,我們編譯並執行這個組合語言程式:

$ ls
hello_world-int.S
$ as -o hello_world-int.o hello_world-int.S
$ ls
hello_world-int.o  hello_world-int.S
$ ld -o hello_world-int hello_world-int.o
$ ls
hello_world-int  hello_world-int.o  hello_world-int.S
$ ./hello_world-int
Hello, world!
複製程式碼

其實,將 系統呼叫號 和 呼叫引數 放進正確的 暫存器 並觸發正確的 軟中斷 是個重複的麻煩事。 C 庫已經把這髒累活給幹了——試試 syscall 函式吧!

#include <string.h>
#include <sys/syscall.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
    char *msg = "Hello, world!\n";
    syscall(SYS_write, 1, msg, strlen(msg));

    return 0;
}
複製程式碼

下一步

訂閱更新,獲取更多學習資料,請關注我們的 微信公眾號 :

小菜學程式設計

參考文獻

  1. Serg Iakovlev
  2. write(2) - Linux manual page
  3. syscall(2) - Linux manual page
  4. _exit(2) - Linux manual page

Linux系統呼叫原理

相關文章