系統呼叫(System Call)是作業系統為在使用者態執行的程式與硬體裝置(如CPU、磁碟、印表機等)進行互動提供的一組介面。當使用者程式需要發生系統呼叫時,CPU 通過軟中斷切換到核心態開始執行核心系統呼叫函式。下面介紹Linux 下三種發生系統呼叫的方法:
通過 glibc 提供的庫函式
glibc 是 Linux 下使用的開源的標準 C 庫,它是 GNU 釋出的 libc 庫,即執行時庫。glibc 為程式設計師提供豐富的 API(Application Programming Interface),除了例如字串處理、數學運算等使用者態服務之外,最重要的是封裝了作業系統提供的系統服務,即系統呼叫的封裝。那麼glibc提供的系統呼叫API與核心特定的系統呼叫之間的關係是什麼呢?
- 通常情況,每個特定的系統呼叫對應了至少一個 glibc 封裝的庫函式,如系統提供的開啟檔案系統呼叫
sys_open
對應的是 glibc 中的open
函式; - 其次,glibc 一個單獨的 API 可能呼叫多個系統呼叫,如 glibc 提供的
printf
函式就會呼叫如sys_open
、sys_mmap
、sys_write
、sys_close
等等系統呼叫; - 另外,多個 API 也可能只對應同一個系統呼叫,如glibc 下實現的
malloc
、calloc
、free
等函式用來分配和釋放記憶體,都利用了核心的sys_brk
的系統呼叫。
舉例來說,我們通過 glibc 提供的chmod
函式來改變檔案 etc/passwd
的屬性為 444:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
#include <sys/types.h> #include <sys/stat.h> #include <errno.h> #include <stdio.h> int main() { int rc; rc = chmod("/etc/passwd", 0444); if (rc == -1) fprintf(stderr, "chmod failed, errno = %d\n", errno); else printf("chmod success!\n"); return 0; } |
在普通使用者下編譯運用,輸出結果為:
1 2 |
chmod failed, errno = 1 |
上面系統呼叫返回的值為-1,說明系統呼叫失敗,錯誤碼為1,在 /usr/include/asm-generic/errno-base.h
檔案中有如下錯誤程式碼說明:
1 2 |
#define EPERM 1 /* Operation not permitted */ |
即無許可權進行該操作,我們以普通使用者許可權是無法修改 /etc/passwd 檔案的屬性的,結果正確。
使用 syscall 直接呼叫
使用上面的方法有很多好處,首先你無須知道更多的細節,如 chmod 系統呼叫號,你只需瞭解 glibc 提供的 API 的原型;其次,該方法具有更好的移植性,你可以很輕鬆將該程式移植到其他平臺,或者將 glibc 庫換成其它庫,程式只需做少量改動。
但有點不足是,如果 glibc 沒有封裝某個核心提供的系統呼叫時,我就沒辦法通過上面的方法來呼叫該系統呼叫。如我自己通過編譯核心增加了一個系統呼叫,這時 glibc 不可能有你新增系統呼叫的封裝 API,此時我們可以利用 glibc 提供的syscall
函式直接呼叫。該函式定義在 unistd.h
標頭檔案中,函式原型如下:
1 |
long int syscall (long int sysno, ...) |
- sysno 是系統呼叫號,每個系統呼叫都有唯一的系統呼叫號來標識。在
sys/syscall.h
中有所有可能的系統呼叫號的巨集定義。 - … 為剩餘可變長的引數,為系統呼叫所帶的引數,根據系統呼叫的不同,可帶0~5個不等的引數,如果超過特定系統呼叫能帶的引數,多餘的引數被忽略。
- 返回值 該函式返回值為特定系統呼叫的返回值,在系統呼叫成功之後你可以將該返回值轉化為特定的型別,如果系統呼叫失敗則返回 -1,錯誤程式碼存放在
errno
中。
還以上面修改 /etc/passwd 檔案的屬性為例,這次使用 syscall 直接呼叫:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
#include <stdio.h> #include <unistd.h> #include <sys/syscall.h> #include <errno.h> int main() { int rc; rc = syscall(SYS_chmod, "/etc/passwd", 0444); if (rc == -1) fprintf(stderr, "chmod failed, errno = %d\n", errno); else printf("chmod succeess!\n"); return 0; } |
在普通使用者下編譯執行,輸出的結果與上例相同。
通過 int 指令陷入
如果我們知道系統呼叫的整個過程的話,應該就能知道使用者態程式通過軟中斷指令int 0x80
來陷入核心態(在Intel Pentium II 又引入了sysenter
指令),引數的傳遞是通過暫存器,eax 傳遞的是系統呼叫號,ebx、ecx、edx、esi和edi 來依次傳遞最多五個引數,當系統呼叫返回時,返回值存放在 eax 中。
仍然以上面的修改檔案屬性為例,將呼叫系統呼叫那段寫成內聯彙編程式碼:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
#include <stdio.h> #include <sys/types.h> #include <sys/syscall.h> #include <errno.h> int main() { long rc; char *file_name = "/etc/passwd"; unsigned short mode = 0444; asm( "int $0x80" : "=a" (rc) : "0" (SYS_chmod), "b" ((long)file_name), "c" ((long)mode) ); if ((unsigned long)rc >= (unsigned long)-132) { errno = -rc; rc = -1; } if (rc == -1) fprintf(stderr, "chmode failed, errno = %d\n", errno); else printf("success!\n"); return 0; } |
如果 eax 暫存器存放的返回值(存放在變數 rc 中)在 -1~-132 之間,就必須要解釋為出錯碼(在/usr/include/asm-generic/errno.h
檔案中定義的最大出錯碼為 132),這時,將錯誤碼寫入 errno 中,置系統呼叫返回值為 -1;否則返回的是 eax 中的值。
上面程式在 32位Linux下以普通使用者許可權編譯執行結果與前面兩個相同!
參考資料
- Understanding The Linux Kernel, the 3rd edtion
- The GNU C Library Reference Manual, for version 2.18