課程簡介
課程目標
- 理解作業系統的設計和實現
- 透過 XV6 作業系統動手實驗,可以擴充套件或改進作業系統
作業系統的目標
- Abstraction:對硬體進行抽象
- Multiplex:在多個應用程式之間共用硬體資源
- Isolation:隔離性,程式出現故障時,不同程式之間不能相互干擾
- Sharing:實現共享,如資料互動或協同完成任務
- Security:想分享的時候可以分享,不想分享的時候可以不分享,可以稱為 Access Control System
- Performance:作業系統至少需要不阻止應用程式獲得高效能,甚至需要幫助應用程式獲取高效能
- Range of oses:對於大部分作業系統,需要支援大量不同型別的應用程式
作業系統結構
系統呼叫函式
read/write 系統呼叫
read
和write
函式在執行時,不會關心讀寫的資料格式,作業系統中(核心)copy 程式會按照 8bit 的位元組流處理資料read
和write
函式中第一個引數代表檔案位置,shell 會確保預設情況下,當一個程式啟動時,檔案描述符 0 連線到 console 的輸入,檔案描述符 1 連線到了 console 的輸出。
open 系統呼叫
- 位元組流就是一段連續的資料按照位元組的長度讀取
open("output.txt", O_WRONLY | O_CREATE);
第二個引數用來告訴 open 系統呼叫在核心中的實現:我們將要建立並寫入一個檔案- 檔案描述符本質上對應了核心中的一個表單資料。核心維護了每個執行程序的狀態,核心會為每一個執行程序儲存一個表單,表單的 key 是檔案描述符。這個表單讓核心知道,每個檔案描述符對應的實際內容是什麼。這裡比較關鍵的點是,每個程序都有自己獨立的檔案描述符空間,所以如果執行了兩個不同的程式,對應兩個不同的程序,如果它們都開啟一個檔案,它們或許可以得到相同數字的檔案描述符,但是因為核心為每個程序都維護了一個獨立的檔案描述符空間,這裡相同數字的檔案描述符可能會對應到不同的檔案。
fork 系統呼叫
-
fork
可以建立新的程序,該程序(子程序)與原程序(父程序)的指令、資料、堆疊、檔案描述符表單完全相同 -
fork
有兩個返回值,但是有獨立的地址空間(都認為記憶體從 0 開始增長)- 在父程序中,返回子程序的 PID
- 在子程序中,返回 0
- 如果建立失敗,返回-1
wait 系統呼叫
-
wait
表示等待一個子程序退出- 如果呼叫者沒有子程序,則
wait
立即返回-1 - 如果父程序不關注子程序的退出時狀態,可以傳一個
0
地址(或者NULL
指標)給wait
pid = wait((int *)0); // 只要一個子程序退出,wait 就結束,返回該退出的子程序的 pid 號
- 如果父程序關注子程序的退出時狀態,可以使用如下方式,
status
將儲存子程序結束時的狀態(子程序退出時exit
裡的引數會被儲存到status
中)
int status; wait(&status);
- 如果呼叫者沒有子程序,則
exit 系統呼叫
exit
系統呼叫退出程式,並釋放資源。exit
需要一個整數狀態引數,0 表示成功,1 表示失敗
exec 系統呼叫
exec
系統呼叫使用新記憶體映像來替換記憶體的程序exec
會保留當前的檔案描述符- 通常
exec
不會返回,只有出錯時才會返回
_char _*argv[3];
argv[0] = "echo";
argv[1] = "hello";
argv[2] = 0; // 標記了陣列的結尾,也可以用NULL指標
exec("/bin/echo", argv); // 相當於echo hello
printf("exec error\n"); // exec出錯時返回,否則不會執行到這裡了
- 一般來說
fork
下的子程序中呼叫exec
函式來替換子程序,但這樣會造成資源浪費,因此核心透過使用虛擬記憶體技術來進行最佳化
pipe 系統呼叫
管道的概念
- 以檔案描述符對的形式提供給程序,一個表示讀端,一個表示寫端
- 本質是一個偽檔案,實質為核心緩衝區
- 管道實際為核心使用環形佇列機制,藉助核心緩衝區(4K)實現
管道的侷限性
- 必須作用在有血緣關係的程序之間
- 資料不能程序自己寫,自己讀(需要兩個程序,一個讀,一個寫)
- 採用半雙工通訊,資料只能單方向流動
- 資料不能反覆讀取
管道函式
int pipe(int fd[2])
:建立並開啟管道
- 引數:
fd[0]
讀端;fd[1]
寫端 - 返回值:
0
成功;-1
失敗
管道程式舉例
int p[2];
char *argv[2];
argv[0] = "wc";
argv[1] = 0;
pipe(p); // 建立並開啟管道
if (fork() == 0) // 子程序
{
close(0); // 釋放檔案描述符0(標準輸入)
dup(p[0]); // 使得檔案描述符0引用了管道讀端p[0]
close(p[0]); // 關閉管道讀端
close(p[1]); // 關閉管道寫端
exec("/bin/wc", argv); // wc相當於從管道讀資料(這裡其實不太理解,管道不是關上了嗎)
}
else // 父程序
{
close(p[0]); // 讀寫只能有一個,父程序將讀端關閉
write(p[1], "hello world\n", 12); // 向管道寫入資料
close(p[1]); // 寫完將管道關閉
}
管道的讀寫行為
- 讀管道:
-
管道中有資料,
read
返回實際讀到的位元組數 -
管道中無資料:
- 管道寫端全部關閉,
read
返回 0 - 管道寫端沒有全部關閉,
read
阻塞等待
- 管道寫端全部關閉,
- 寫管道:
-
管道讀端全部關閉,程序異常終止(SIGPIPE 訊號導致的)
-
管道讀端沒有全部關閉:
- 管道已滿,
write
阻塞 - 管道未滿,
write
將資料寫入,並返回實際寫入的位元組數
- 管道已滿,
File system
檔案系統
- xv6 檔案系統包含了資料檔案(擁有位元組陣列)和目錄(擁有對資料檔案和其他目錄的命名引用)
- 以
/
開頭的如/a/b
表示根目錄/
中a
目錄中名為b
的檔案或目錄(絕對路徑),不以/
開頭的是相對於當前目錄的路徑(相對路徑)
chdir 系統呼叫
透過 chdir
系統呼叫可以改變程序的當前目錄,如下兩個 open
開啟了同一個檔案
chdir("/a");
chdir("b");
open("c", O_RDONLY);
open("/a/b/c", O_RDONLY);
建立檔案和目錄
mkdir
可以建立一個新的目錄,open
使用 O_CREATE
可以建立新的資料檔案,mknod
可以建立一個新的裝置檔案
mkdir("/dir");
fd = open("/dir/file", O_CREATE | O_WRONLY);
close(fd);
mknod("/console", 1, 1); // 主裝置號,次裝置號,唯一標識一個核心裝置
當一個程序開啟裝置檔案後,核心會將系統的讀寫呼叫轉移到核心裝置實現上,而不是將它們傳遞給檔案系統
檔案連結
inode
是作業系統用來儲存除了檔名和實際資料的資料結構,它是用來連線實際資料和檔名的;每個inode
儲存著檔案的後設資料,包括檔案的型別(檔案 or 目錄 or 裝置)、長度、內容在磁碟的位置以及檔案的連結數量fstat
系統呼叫從檔案描述符引用的 inode 中檢索資訊
// int fstat(int fd, struct stat*),stat為接收inode資訊的結構體,如fstat(fd, &st)
#define T_DIR 1 // Directory
#define T_FILE 2 // File
#define T_DEVICE 3 // Device
struct stat {
int dev; // File system's disk device
uint ino; // Inode number
short type; // Type of file
short nlink; // Number of links to file
uint64 size; // Size of file in bytes
};
link
系統呼叫建立了一個引用同一個inode
的檔案
open("a", O_CREATE | O_WRONLY);
link("a", "b"); // 建立檔案b,且a和b指向同一個inode
unlink
系統呼叫會從檔案系統中刪除一個檔名,只有當檔案連結數為零且沒有檔案描述符引用它時,檔案inode
和存放其內容的磁碟空間才會被釋放
unlink("a"); // 刪除a,此時只有b引用inode
// 建立臨時檔案的一種慣用方式,它建立一個無名稱的inode,在程序關閉fd或退出時刪除檔案
fd = open("/tmp/x", O_CREATE | O_WRONLY);
unlink("/tmp/x");
Linux 命令
xargs 命令
- 作用:將標準輸入轉為命令列引數;
xargs
的作用在於,大多數命令(比如rm
、mkdir
、ls
)與管道一起使用時,都需要xargs
將標準輸入轉為命令列引數。
$ echo "hello world" | xargs echo
hello world
上面的程式碼將管道左側的標準輸入,轉為命令列引數 hello world
,傳給第二個 echo
命令
$ echo "one two three" | xargs mkdir
上面的程式碼等同於 mkdir one two three
。如果不加 xargs
就會報錯,提示 mkdir
缺少操作引數
- 命令格式如下:
$ xargs [-options] [command]
真正執行的命令,緊跟在 xargs
後面,接受 xargs
傳來的引數