當你在 Linux 上啟動一個程式時會發生什麼?
本文是關於 fork 和 exec 是如何在 Unix 上工作的。你或許已經知道,也有人還不知道。幾年前當我瞭解到這些時,我驚歎不已。
我們要做的是啟動一個程式。我們已經在部落格上討論了很多關於系統呼叫的問題,每當你啟動一個程式或者開啟一個檔案,這都是一個系統呼叫。所以你可能會認為有這樣的系統呼叫:
start_process(["ls", "-l", "my_cool_directory"])
這是一個合理的想法,顯然這是它在 DOS 或 Windows 中的工作原理。我想說的是,這並不是 Linux 上的工作原理。但是,我查閱了文件,確實有一個 的系統呼叫基本上是這樣做的,不過這不在本文的討論範圍內。
Linux 上的 posix_spawn
是透過兩個系統呼叫實現的,分別是 fork
和 exec
(實際上是 execve
),這些都是人們常常使用的。儘管在 OS X 上,人們使用 posix_spawn
,而 fork
和 exec
是不提倡的,但我們將討論的是 Linux。
Linux 中的每個程式都存在於“程式樹”中。你可以透過執行 pstree
命令檢視程式樹。樹的根是 init
,程式號是 1。每個程式(init
除外)都有一個父程式,一個程式都可以有很多子程式。
所以,假設我要啟動一個名為 ls
的程式來列出一個目錄。我是不是隻要發起一個程式 ls
就好了呢?不是的。
我要做的是,建立一個子程式,這個子程式是我(me
)本身的一個克隆,然後這個子程式的“腦子”被吃掉了,變成 ls
。
開始是這樣的:
my parent |- me
然後執行 fork()
,生成一個子程式,是我(me
)自己的一份克隆:
my parent |- me |-- clone of me
然後我讓該子程式執行 exec("ls")
,變成這樣:
my parent |- me |-- ls
當 ls 命令結束後,我幾乎又變回了我自己:
my parent |- me |-- ls (zombie)
在這時 ls
其實是一個殭屍程式。這意味著它已經死了,但它還在等我,以防我需要檢查它的返回值(使用 wait
系統呼叫)。一旦我獲得了它的返回值,我將再次恢復獨自一人的狀態。
my parent |- me
如果你要編寫一個 shell,這是你必須做的一個練習(這是一個非常有趣和有啟發性的專案。Kamal 在 Github 上有一個很棒的研討會:)。
事實證明,有了 C 或 Python 的技能,你可以在幾個小時內編寫一個非常簡單的 shell,像 bash 一樣。(至少如果你旁邊能有個人多少懂一點,如果沒有的話用時會久一點。)我已經完成啦,真的很棒。
這就是 fork
和 exec
在程式中的實現。我寫了一段 C 的虛擬碼。請記住,
int pid = fork();// 我要分身啦// “我”是誰呢?可能是子程式也可能是父程式if (pid == 0) { // 我現在是子程式 // “ls” 吃掉了我腦子,然後變成一個完全不一樣的程式 exec(["ls"]) } else if (pid == -1) { // 天啊,fork 失敗了,簡直是災難!} else { // 我是父程式耶 // 繼續做一個酷酷的美男子吧 // 需要的話,我可以等待子程式結束}
程式有很多屬性:
開啟的檔案(包括開啟的網路連線)
環境變數
訊號處理程式(在程式上執行 Ctrl + C 時會發生什麼?)
記憶體(你的“地址空間”)
暫存器
可執行檔案(
/proc/$pid/exe
)cgroups 和名稱空間(與 Linux 容器相關)
當前的工作目錄
執行程式的使用者
其他我還沒想到的
當你執行 execve
並讓另一個程式吃掉你的腦子的時候,實際上幾乎所有東西都是相同的! 你們有相同的環境變數、訊號處理程式和開啟的檔案等等。
唯一改變的是,記憶體、暫存器以及正在執行的程式,這可是件大事。
你可能會問:“如果我有一個使用了 2GB 記憶體的程式,這是否意味著每次我啟動一個子程式,所有 2 GB 的記憶體都要被複制一次?這聽起來要耗費很多資源!”
事實上,Linux 為 fork()
呼叫實現了寫時複製copy on write,對於新程式的 2GB 記憶體來說,就像是“看看舊的程式就好了,是一樣的!”。然後,當如果任一程式試圖寫入記憶體,此時系統才真正地複製一個記憶體的副本給該程式。如果兩個程式的記憶體是相同的,就不需要複製了。
你可能會說,好吧,這些細節聽起來很厲害,但為什麼這麼重要?關於訊號處理程式或環境變數的細節會被繼承嗎?這對我的日常程式設計有什麼實際影響呢?
有可能哦!比如說,在 Kamal 的部落格上有一個很有意思的 。它討論了 Python 如何使訊號處理程式忽略了 SIGPIPE
。也就是說,如果你從 Python 裡執行一個程式,預設情況下它會忽略 SIGPIPE
!這意味著,程式從 Python 指令碼和從 shell 啟動的表現會有所不同。在這種情況下,它會造成一個奇怪的問題。
所以,你的程式的環境(環境變數、訊號處理程式等)可能很重要,都是從父程式繼承來的。知道這些,在除錯時是很有用的。
via: https://jvns.ca/blog/2016/10/04/exec-will-eat-your-brain/
作者: 譯者: 校對:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/75/viewspace-2809048/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 在Linux上啟動程式時會發生什麼?Linux
- 當你開啟終端並輸入命令時會發生什麼?(上)
- Java 當一個int和double相加 會發生什麼?Java
- 【iOS】當我們在application:DidFinishLaunchWithOptions:中返回NO時會發生什麼iOSAPP
- linux終端關閉時為什麼會導致在其上啟動的程式退出?Linux
- 當你在瀏覽器中輸入URL回車後會發生什麼?瀏覽器
- 當你建立了一個 Deployment 時,Kubernetes 內部發生了什麼?
- 在Kubernetes中建立Pod時會發生什麼? - daniele
- 你在終端啟動的程式,最後都是什麼下場?(上)
- 事件發生時,你在想什麼?事件
- 經典面試題:當你輸入一個網址後回車,實際會發生什麼?面試題
- Linux中什麼情況下會發生程式排程?Linux
- 【科普】如果程式設計師穿越到古代當皇帝,會發生什麼?程式設計師
- 當 Redis 發生高延遲時,到底發生了什麼Redis
- 當我們談 Java 併發的時候,你們在談什麼?Java
- Linux中如何啟動程式?啟動程式的方法是什麼?Linux
- [Redis原始碼閱讀]當你啟動Redis的時候,Redis做了什麼Redis原始碼
- 在瀏覽器中輸入一個URL,按下回車會發生什麼?瀏覽器
- mysql什麼時候會發生file sortMySql
- 當雜湊表遇上鍊表會發生什麼呢?
- 當提到“事件驅動”時,我們在說什麼?事件
- 當你在瀏覽器輸入一個網址,回車後究竟發生了什麼?瀏覽器
- 當大資料邂逅六西格瑪,會發生什麼?大資料
- 當我們開發一個介面時需要注意些什麼
- 當一個 Pod 被排程時,Kubernetes 內部發生了什麼?
- [譯] 當你建立 Flexbox 佈局時,都發生了什麼?Flex
- 你在終端啟動的程式,最後都是什麼下場?(下)
- 把 13 億中國人拉到一個群會發生什麼?
- 當我談自律的時候,我會談什麼(一)
- 在Linux中,開機啟動過程是什麼?Linux
- 為什麼JavaScript是你應當學習的下一個(或第一個)程式語言JavaScript
- 為什麼你的發行版仍然在使用“過時的”Linux 核心?Linux
- 啟動vue專案時發生了什麼Vue
- 你永遠不會知道這個學生會在搞什麼 ——《三〇一室無一人》的敘事展開
- linux 啟動jar包:在 Linux 上啟動 Java jar 包的方法LinuxJARJava
- 當執行時,發生了什麼?
- 下一個十年,遊戲在可玩性上會有什麼樣的發展?遊戲
- 當mysql表從壓縮表變成普通表會發生什麼MySql