MIT6.S081 - Lecture1: Introduction and Examples

jll133688發表於2024-04-15

原文網址 : https://www.cnblogs.com/jll133688/p/18136905

MIT

課程簡介

課程目標

理解作業系統的設計和實現
透過 XV6 作業系統動手實驗，可以擴充套件或改進作業系統

作業系統的目標

Abstraction：對硬體進行抽象
Multiplex：在多個應用程式之間共用硬體資源
Isolation：隔離性，程式出現故障時，不同程式之間不能相互干擾
Sharing：實現共享，如資料互動或協同完成任務
Security：想分享的時候可以分享，不想分享的時候可以不分享，可以稱為 Access Control System
Performance：作業系統至少需要不阻止應用程式獲得高效能，甚至需要幫助應用程式獲取高效能
Range of oses：對於大部分作業系統，需要支援大量不同型別的應用程式

作業系統結構

系統呼叫函式

read/write 系統呼叫

read 和 write 函式在執行時，不會關心讀寫的資料格式，作業系統中（核心）copy 程式會按照 8bit 的位元組流處理資料
read 和 write 函式中第一個引數代表檔案位置，shell 會確保預設情況下，當一個程式啟動時，檔案描述符 0 連線到 console 的輸入，檔案描述符 1 連線到了 console 的輸出。

open 系統呼叫

位元組流就是一段連續的資料按照位元組的長度讀取
open("output.txt", O_WRONLY | O_CREATE); 第二個引數用來告訴 open 系統呼叫在核心中的實現：我們將要建立並寫入一個檔案
檔案描述符本質上對應了核心中的一個表單資料。核心維護了每個執行程序的狀態，核心會為每一個執行程序儲存一個表單，表單的 key 是檔案描述符。這個表單讓核心知道，每個檔案描述符對應的實際內容是什麼。這裡比較關鍵的點是，每個程序都有自己獨立的檔案描述符空間，所以如果執行了兩個不同的程式，對應兩個不同的程序，如果它們都開啟一個檔案，它們或許可以得到相同數字的檔案描述符，但是因為核心為每個程序都維護了一個獨立的檔案描述符空間，這裡相同數字的檔案描述符可能會對應到不同的檔案。

fork 系統呼叫

fork 可以建立新的程序，該程序（子程序）與原程序（父程序）的指令、資料、堆疊、檔案描述符表單完全相同
fork 有兩個返回值，但是有獨立的地址空間（都認為記憶體從 0 開始增長）
- 在父程序中，返回子程序的 PID
- 在子程序中，返回 0
- 如果建立失敗，返回-1

wait 系統呼叫

wait 表示等待一個子程序退出
- 如果呼叫者沒有子程序，則 wait 立即返回-1
- 如果父程序不關注子程序的退出時狀態，可以傳一個 0 地址（或者 NULL 指標）給 wait
```
pid = wait((int *)0);   // 只要一個子程序退出，wait 就結束，返回該退出的子程序的 pid 號
```
- 如果父程序關注子程序的退出時狀態，可以使用如下方式，status將儲存子程序結束時的狀態（子程序退出時exit裡的引數會被儲存到status中）
```
int status；
wait（&status);
```

exit 系統呼叫

exit 系統呼叫退出程式，並釋放資源。exit 需要一個整數狀態引數，0 表示成功，1 表示失敗

exec 系統呼叫

exec 系統呼叫使用新記憶體映像來替換記憶體的程序
- exec 會保留當前的檔案描述符
- 通常 exec 不會返回，只有出錯時才會返回

_char _*argv[3]; 
argv[0] = "echo"; 
argv[1] = "hello"; 
argv[2] = 0;      // 標記了陣列的結尾，也可以用NULL指標
exec("/bin/echo", argv);   // 相當於echo hello
printf("exec error\n");    // exec出錯時返回，否則不會執行到這裡了

一般來說 fork 下的子程序中呼叫 exec 函式來替換子程序，但這樣會造成資源浪費，因此核心透過使用虛擬記憶體技術來進行最佳化

pipe 系統呼叫

管道的概念

以檔案描述符對的形式提供給程序，一個表示讀端，一個表示寫端
本質是一個偽檔案，實質為核心緩衝區
管道實際為核心使用環形佇列機制，藉助核心緩衝區（4K）實現

管道的侷限性

必須作用在有血緣關係的程序之間
資料不能程序自己寫，自己讀（需要兩個程序，一個讀，一個寫）
採用半雙工通訊，資料只能單方向流動
資料不能反覆讀取

管道函式

int pipe(int fd[2]) ：建立並開啟管道

引數：fd[0] 讀端；fd[1] 寫端
返回值：0 成功；-1 失敗

管道程式舉例

int p[2]; 
char *argv[2]; 
argv[0] = "wc"; 
argv[1] = 0; 
pipe(p);            // 建立並開啟管道
if (fork() == 0)   // 子程序
{ 
    close(0);     // 釋放檔案描述符0（標準輸入）
    dup(p[0]);    // 使得檔案描述符0引用了管道讀端p[0]
    close(p[0]);  // 關閉管道讀端
    close(p[1]);  // 關閉管道寫端 
    exec("/bin/wc", argv);  // wc相當於從管道讀資料（這裡其實不太理解，管道不是關上了嗎）
} 
else             // 父程序
{ 
    close(p[0]);   // 讀寫只能有一個，父程序將讀端關閉
    write(p[1], "hello world\n", 12);  // 向管道寫入資料
    close(p[1]);  // 寫完將管道關閉
}

管道的讀寫行為

讀管道：

管道中有資料，read 返回實際讀到的位元組數
管道中無資料：
- 管道寫端全部關閉，read 返回 0
- 管道寫端沒有全部關閉，read 阻塞等待

寫管道：

管道讀端全部關閉，程序異常終止（SIGPIPE 訊號導致的）
管道讀端沒有全部關閉：
- 管道已滿，write 阻塞
- 管道未滿，write 將資料寫入，並返回實際寫入的位元組數

File system

檔案系統

xv6 檔案系統包含了資料檔案（擁有位元組陣列）和目錄（擁有對資料檔案和其他目錄的命名引用）
以 / 開頭的如 /a/b 表示根目錄 / 中 a 目錄中名為 b 的檔案或目錄（絕對路徑），不以 / 開頭的是相對於當前目錄的路徑（相對路徑）

chdir 系統呼叫

透過 chdir 系統呼叫可以改變程序的當前目錄，如下兩個 open 開啟了同一個檔案

chdir("/a");
chdir("b");
open("c", O_RDONLY);
open("/a/b/c", O_RDONLY);

建立檔案和目錄

mkdir 可以建立一個新的目錄，open 使用 O_CREATE 可以建立新的資料檔案，mknod 可以建立一個新的裝置檔案

mkdir("/dir");
fd = open("/dir/file", O_CREATE | O_WRONLY);
close(fd);

mknod("/console", 1, 1);  // 主裝置號，次裝置號，唯一標識一個核心裝置

當一個程序開啟裝置檔案後，核心會將系統的讀寫呼叫轉移到核心裝置實現上，而不是將它們傳遞給檔案系統

檔案連結

inode 是作業系統用來儲存除了檔名和實際資料的資料結構，它是用來連線實際資料和檔名的；每個 inode 儲存著檔案的後設資料，包括檔案的型別（檔案 or 目錄 or 裝置）、長度、內容在磁碟的位置以及檔案的連結數量
fstat 系統呼叫從檔案描述符引用的 inode 中檢索資訊

// int fstat(int fd, struct stat*)，stat為接收inode資訊的結構體，如fstat(fd, &st)
#define T_DIR     1   // Directory
#define T_FILE    2   // File
#define T_DEVICE  3   // Device

struct stat {
  int dev;     // File system's disk device
  uint ino;    // Inode number
  short type;  // Type of file
  short nlink; // Number of links to file
  uint64 size; // Size of file in bytes
};

link 系統呼叫建立了一個引用同一個 inode 的檔案

open("a", O_CREATE | O_WRONLY);
link("a", "b");  // 建立檔案b，且a和b指向同一個inode

unlink 系統呼叫會從檔案系統中刪除一個檔名，只有當檔案連結數為零且沒有檔案描述符引用它時，檔案 inode 和存放其內容的磁碟空間才會被釋放

unlink("a");   // 刪除a，此時只有b引用inode

// 建立臨時檔案的一種慣用方式，它建立一個無名稱的inode，在程序關閉fd或退出時刪除檔案
fd = open("/tmp/x", O_CREATE | O_WRONLY);
unlink("/tmp/x");

Linux 命令

xargs 命令

作用：將標準輸入轉為命令列引數；xargs 的作用在於，大多數命令（比如 rm、mkdir、ls）與管道一起使用時，都需要 xargs 將標準輸入轉為命令列引數。

$ echo "hello world" | xargs echo
hello world

上面的程式碼將管道左側的標準輸入，轉為命令列引數 hello world，傳給第二個 echo 命令

$ echo "one two three" | xargs mkdir

上面的程式碼等同於 mkdir one two three。如果不加 xargs 就會報錯，提示 mkdir 缺少操作引數

命令格式如下：

$ xargs [-options] [command]

真正執行的命令，緊跟在 xargs 後面，接受 xargs 傳來的引數

cs231n lecture1 introduction
2020-04-05
VirtualHost Examples
2020-04-04
simd examples
2024-07-18
Introduction to A*
2019-04-24
crewAI-examples
2024-09-16
AI
gitglossary learning by examples
2022-09-16
Git
Introduction to Vetors
2024-11-17
RL Introduction
2024-06-06
nodejs introduction
2021-01-13
NodeJS
examples for oracle ref cursors
2019-01-20
Oracle
"bare repository" learning by examples
2022-09-15
airflow DAG/PIPELINE examples reference
2024-08-06
AI
Ten examples of git-archive
2022-09-08
GitHive
self-introduction
2018-08-02
HTML 01 - Introduction
2024-05-13
HTML
TLS 1.3 Introduction
2019-02-08
TLS
A gentle introduction to multithreading
2019-03-13
thread
FFmpeg Filtering Introduction
2024-11-11
Filter
Introduction to Systems Programming .
2024-12-10
Machine Learning－Introduction
2019-04-03
Mac
HMAC: Introduction, History, and Applications
2024-04-22
MacAPP
1 Introduction to the Multitenant Architecture
2020-02-17
NaN
An introduction to SAP Business Workflow
2019-07-05
zero-shot-learning-definition-examples-comparison
2024-06-17
EESA01 Introduction to Environmental
2024-11-14
CSCI1120 Introduction to Computing
2024-11-26
CCIT4020 Introduction to Computer
2024-12-08
MIT6.S081 - Lab2: system calls
2024-04-23
MIT
cannot find trajectory file at ./examples/trajectory.txt
2020-10-08
【Basic Abstract Algebra】Exercises for Section 2.1 — Definitions and examples
2024-12-09
Neural Radiance Field (NeRF): A Gentle Introduction
2024-04-03
CCIT4020 Introduction to Computer Programming
2024-11-16
CS439: Introduction to Data Science
2024-10-11
MA2552 Introduction to Computing (DLI)
2024-10-05
CPSC 219: Introduction to Computer Science II
2024-10-03
COMP42215 Introduction to Computer Science
2024-12-06
INT2067 Introduction to Programming and Problem Solving
2024-11-06
MIT6.S081 - Lecture3: OS Organization and System Calls
2024-04-20
MIT