MIT6.S081 - Lecture1: Introduction and Examples

jll133688發表於2024-04-15

課程簡介

課程目標

  1. 理解作業系統的設計和實現
  2. 透過 XV6 作業系統動手實驗,可以擴充套件或改進作業系統

作業系統的目標

  1. Abstraction:對硬體進行抽象
  2. Multiplex:在多個應用程式之間共用硬體資源
  3. Isolation:隔離性,程式出現故障時,不同程式之間不能相互干擾
  4. Sharing:實現共享,如資料互動或協同完成任務
  5. Security:想分享的時候可以分享,不想分享的時候可以不分享,可以稱為 Access Control System
  6. Performance:作業系統至少需要不阻止應用程式獲得高效能,甚至需要幫助應用程式獲取高效能
  7. Range of oses:對於大部分作業系統,需要支援大量不同型別的應用程式

作業系統結構

系統呼叫函式

read/write 系統呼叫

  • readwrite 函式在執行時,不會關心讀寫的資料格式,作業系統中(核心)copy 程式會按照 8bit 的位元組流處理資料
  • readwrite 函式中第一個引數代表檔案位置,shell 會確保預設情況下,當一個程式啟動時,檔案描述符 0 連線到 console 的輸入,檔案描述符 1 連線到了 console 的輸出。

open 系統呼叫

  • 位元組流就是一段連續的資料按照位元組的長度讀取
  • open("output.txt", O_WRONLY | O_CREATE); 第二個引數用來告訴 open 系統呼叫在核心中的實現:我們將要建立寫入一個檔案
  • 檔案描述符本質上對應了核心中的一個表單資料。核心維護了每個執行程序的狀態,核心會為每一個執行程序儲存一個表單,表單的 key 是檔案描述符。這個表單讓核心知道,每個檔案描述符對應的實際內容是什麼。這裡比較關鍵的點是,每個程序都有自己獨立的檔案描述符空間,所以如果執行了兩個不同的程式,對應兩個不同的程序,如果它們都開啟一個檔案,它們或許可以得到相同數字的檔案描述符,但是因為核心為每個程序都維護了一個獨立的檔案描述符空間,這裡相同數字的檔案描述符可能會對應到不同的檔案

fork 系統呼叫

  • fork 可以建立新的程序,該程序(子程序)與原程序(父程序)的指令、資料、堆疊、檔案描述符表單完全相同

  • fork 有兩個返回值,但是有獨立的地址空間(都認為記憶體從 0 開始增長)

    • 在父程序中,返回子程序的 PID
    • 在子程序中,返回 0
    • 如果建立失敗,返回-1

wait 系統呼叫

  • wait 表示等待一個子程序退出

    • 如果呼叫者沒有子程序,則 wait 立即返回-1
    • 如果父程序不關注子程序的退出時狀態,可以傳一個 0 地址(或者 NULL 指標)給 wait
    pid = wait((int *)0);   // 只要一個子程序退出,wait 就結束,返回該退出的子程序的 pid 號
    
    • 如果父程序關注子程序的退出時狀態,可以使用如下方式,status將儲存子程序結束時的狀態(子程序退出時exit裡的引數會被儲存到status中)
    int status;
    wait(&status);
    

exit 系統呼叫

  • exit 系統呼叫退出程式,並釋放資源。exit 需要一個整數狀態引數,0 表示成功,1 表示失敗

exec 系統呼叫

  • exec 系統呼叫使用新記憶體映像來替換記憶體的程序
    • exec 會保留當前的檔案描述符
    • 通常 exec 不會返回,只有出錯時才會返回
_char _*argv[3]; 
argv[0] = "echo"; 
argv[1] = "hello"; 
argv[2] = 0;      // 標記了陣列的結尾,也可以用NULL指標
exec("/bin/echo", argv);   // 相當於echo hello
printf("exec error\n");    // exec出錯時返回,否則不會執行到這裡了
  • 一般來說 fork 下的子程序中呼叫 exec 函式來替換子程序,但這樣會造成資源浪費,因此核心透過使用虛擬記憶體技術來進行最佳化

pipe 系統呼叫

管道的概念

  1. 以檔案描述符對的形式提供給程序,一個表示讀端,一個表示寫端
  2. 本質是一個偽檔案,實質為核心緩衝區
  3. 管道實際為核心使用環形佇列機制,藉助核心緩衝區(4K)實現

管道的侷限性

  1. 必須作用在有血緣關係的程序之間
  2. 資料不能程序自己寫,自己讀(需要兩個程序,一個讀,一個寫)
  3. 採用半雙工通訊,資料只能單方向流動
  4. 資料不能反覆讀取

管道函式

int pipe(int fd[2]) :建立並開啟管道

  • 引數:fd[0] 讀端fd[1] 寫端
  • 返回值:0 成功;-1 失敗

管道程式舉例

int p[2]; 
char *argv[2]; 
argv[0] = "wc"; 
argv[1] = 0; 
pipe(p);            // 建立並開啟管道
if (fork() == 0)   // 子程序
{ 
    close(0);     // 釋放檔案描述符0(標準輸入)
    dup(p[0]);    // 使得檔案描述符0引用了管道讀端p[0]
    close(p[0]);  // 關閉管道讀端
    close(p[1]);  // 關閉管道寫端 
    exec("/bin/wc", argv);  // wc相當於從管道讀資料(這裡其實不太理解,管道不是關上了嗎)
} 
else             // 父程序
{ 
    close(p[0]);   // 讀寫只能有一個,父程序將讀端關閉
    write(p[1], "hello world\n", 12);  // 向管道寫入資料
    close(p[1]);  // 寫完將管道關閉
}

管道的讀寫行為

  1. 讀管道:
  • 管道中有資料,read 返回實際讀到的位元組數

  • 管道中無資料:

    • 管道寫端全部關閉read 返回 0
    • 管道寫端沒有全部關閉read 阻塞等待
  1. 寫管道:
  • 管道讀端全部關閉,程序異常終止(SIGPIPE 訊號導致的)

  • 管道讀端沒有全部關閉

    • 管道已滿,write 阻塞
    • 管道未滿,write 將資料寫入,並返回實際寫入的位元組數

File system

檔案系統

  1. xv6 檔案系統包含了資料檔案(擁有位元組陣列)和目錄(擁有對資料檔案和其他目錄的命名引用)
  2. / 開頭的如 /a/b 表示根目錄 /a 目錄中名為 b 的檔案或目錄(絕對路徑),不以 / 開頭的是相對於當前目錄的路徑(相對路徑)

chdir 系統呼叫

透過 chdir 系統呼叫可以改變程序的當前目錄,如下兩個 open 開啟了同一個檔案

chdir("/a");
chdir("b");
open("c", O_RDONLY);
open("/a/b/c", O_RDONLY);

建立檔案和目錄

mkdir 可以建立一個新的目錄open 使用 O_CREATE 可以建立新的資料檔案mknod 可以建立一個新的裝置檔案

mkdir("/dir");
fd = open("/dir/file", O_CREATE | O_WRONLY);
close(fd);

mknod("/console", 1, 1);  // 主裝置號,次裝置號,唯一標識一個核心裝置

當一個程序開啟裝置檔案後,核心會將系統的讀寫呼叫轉移到核心裝置實現上,而不是將它們傳遞給檔案系統

檔案連結

  • inode 是作業系統用來儲存除了檔名和實際資料的資料結構,它是用來連線實際資料和檔名的;每個 inode 儲存著檔案的後設資料,包括檔案的型別(檔案 or 目錄 or 裝置)、長度、內容在磁碟的位置以及檔案的連結數量
  • fstat 系統呼叫從檔案描述符引用的 inode 中檢索資訊
// int fstat(int fd, struct stat*),stat為接收inode資訊的結構體,如fstat(fd, &st)
#define T_DIR     1   // Directory
#define T_FILE    2   // File
#define T_DEVICE  3   // Device

struct stat {
  int dev;     // File system's disk device
  uint ino;    // Inode number
  short type;  // Type of file
  short nlink; // Number of links to file
  uint64 size; // Size of file in bytes
};
  • link 系統呼叫建立了一個引用同一個 inode 的檔案
open("a", O_CREATE | O_WRONLY);
link("a", "b");  // 建立檔案b,且a和b指向同一個inode
  • unlink 系統呼叫會從檔案系統中刪除一個檔名,只有當檔案連結數為且沒有檔案描述符引用它時,檔案 inode 和存放其內容的磁碟空間才會被釋放
unlink("a");   // 刪除a,此時只有b引用inode

// 建立臨時檔案的一種慣用方式,它建立一個無名稱的inode,在程序關閉fd或退出時刪除檔案
fd = open("/tmp/x", O_CREATE | O_WRONLY);
unlink("/tmp/x");

Linux 命令

xargs 命令

  • 作用:將標準輸入轉為命令列引數;xargs 的作用在於,大多數命令(比如 rmmkdirls)與管道一起使用時,都需要 xargs 將標準輸入轉為命令列引數。
$ echo "hello world" | xargs echo
hello world

上面的程式碼將管道左側的標準輸入,轉為命令列引數 hello world,傳給第二個 echo 命令

$ echo "one two three" | xargs mkdir

上面的程式碼等同於 mkdir one two three。如果不加 xargs 就會報錯,提示 mkdir 缺少操作引數

  • 命令格式如下:
$ xargs [-options] [command]

真正執行的命令,緊跟在 xargs 後面,接受 xargs 傳來的引數

相關文章