Linux 下系統呼叫的三種方法

發表於2016-11-05

系統呼叫(System Call)是作業系統為在使用者態執行的程式與硬體裝置(如CPU、磁碟、印表機等)進行互動提供的一組介面。當使用者程式需要發生系統呼叫時,CPU 通過軟中斷切換到核心態開始執行核心系統呼叫函式。下面介紹Linux 下三種發生系統呼叫的方法:

通過 glibc 提供的庫函式

glibc 是 Linux 下使用的開源的標準 C 庫,它是 GNU 釋出的 libc 庫,即執行時庫。glibc 為程式設計師提供豐富的 API(Application Programming Interface),除了例如字串處理、數學運算等使用者態服務之外,最重要的是封裝了作業系統提供的系統服務,即系統呼叫的封裝。那麼glibc提供的系統呼叫API與核心特定的系統呼叫之間的關係是什麼呢?

  • 通常情況,每個特定的系統呼叫對應了至少一個 glibc 封裝的庫函式,如系統提供的開啟檔案系統呼叫 sys_open 對應的是 glibc 中的 open 函式;
  • 其次,glibc 一個單獨的 API 可能呼叫多個系統呼叫,如 glibc 提供的 printf 函式就會呼叫如 sys_opensys_mmapsys_writesys_close 等等系統呼叫;
  • 另外,多個 API 也可能只對應同一個系統呼叫,如glibc 下實現的 malloccallocfree 等函式用來分配和釋放記憶體,都利用了核心的 sys_brk 的系統呼叫。

舉例來說,我們通過 glibc 提供的chmod 函式來改變檔案 etc/passwd 的屬性為 444:

在普通使用者下編譯運用,輸出結果為:

上面系統呼叫返回的值為-1,說明系統呼叫失敗,錯誤碼為1,在 /usr/include/asm-generic/errno-base.h 檔案中有如下錯誤程式碼說明:

即無許可權進行該操作,我們以普通使用者許可權是無法修改 /etc/passwd 檔案的屬性的,結果正確。

使用 syscall 直接呼叫

使用上面的方法有很多好處,首先你無須知道更多的細節,如 chmod 系統呼叫號,你只需瞭解 glibc 提供的 API 的原型;其次,該方法具有更好的移植性,你可以很輕鬆將該程式移植到其他平臺,或者將 glibc 庫換成其它庫,程式只需做少量改動。
但有點不足是,如果 glibc 沒有封裝某個核心提供的系統呼叫時,我就沒辦法通過上面的方法來呼叫該系統呼叫。如我自己通過編譯核心增加了一個系統呼叫,這時 glibc 不可能有你新增系統呼叫的封裝 API,此時我們可以利用 glibc 提供的syscall 函式直接呼叫。該函式定義在 unistd.h 標頭檔案中,函式原型如下:

  • sysno 是系統呼叫號,每個系統呼叫都有唯一的系統呼叫號來標識。在 sys/syscall.h 中有所有可能的系統呼叫號的巨集定義。
  •  為剩餘可變長的引數,為系統呼叫所帶的引數,根據系統呼叫的不同,可帶0~5個不等的引數,如果超過特定系統呼叫能帶的引數,多餘的引數被忽略。
  • 返回值 該函式返回值為特定系統呼叫的返回值,在系統呼叫成功之後你可以將該返回值轉化為特定的型別,如果系統呼叫失敗則返回 -1,錯誤程式碼存放在 errno 中。

還以上面修改 /etc/passwd 檔案的屬性為例,這次使用 syscall 直接呼叫:

在普通使用者下編譯執行,輸出的結果與上例相同。

通過 int 指令陷入

如果我們知道系統呼叫的整個過程的話,應該就能知道使用者態程式通過軟中斷指令int 0x80 來陷入核心態(在Intel Pentium II 又引入了sysenter指令),引數的傳遞是通過暫存器,eax 傳遞的是系統呼叫號,ebx、ecx、edx、esi和edi 來依次傳遞最多五個引數,當系統呼叫返回時,返回值存放在 eax 中。

仍然以上面的修改檔案屬性為例,將呼叫系統呼叫那段寫成內聯彙編程式碼:

如果 eax 暫存器存放的返回值(存放在變數 rc 中)在 -1~-132 之間,就必須要解釋為出錯碼(在/usr/include/asm-generic/errno.h 檔案中定義的最大出錯碼為 132),這時,將錯誤碼寫入 errno 中,置系統呼叫返回值為 -1;否則返回的是 eax 中的值。

上面程式在 32位Linux下以普通使用者許可權編譯執行結果與前面兩個相同!


參考資料

  • Understanding The Linux Kernel, the 3rd edtion
  • The GNU C Library Reference Manual, for version 2.18

相關文章