來源:陳皓
前兩天有人問了個關於Unix的fork()系統呼叫的面試題,這個題正好是我大約十年前找工作時某公司問我的一個題,我覺得比較有趣,寫篇文章與大家分享一下。這個題是這樣的:
題目:請問下面的程式一共輸出多少個“-”?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); printf("-"); } return 0; } |
如果你對fork()的機制比較熟悉的話,這個題並不難,輸出應該是6個“-”,但是,實際上這個程式會很tricky地輸出8個“-”。
要講清這個題,我們首先需要知道fork()系統呼叫的特性,
●fork()系統呼叫是Unix下以自身程式建立子程式的系統呼叫,一次呼叫,兩次返回,如果返回是0,則是子程式,如果返回值>0,則是父程式(返回值是子程式的pid),這是眾為周知的。
●還有一個很重要的東西是,在fork()的呼叫處,整個父程式空間會原模原樣地複製到子程式中,包括指令,變數值,程式呼叫棧,環境變數,緩衝區,等等。
所以,上面的那個程式為什麼會輸入8個“-”,這是因為printf(“-”);語句有buffer,所以,對於上述程式,printf(“-”);把“-”放到了快取中,並沒有真正的輸出(參看《C語言的迷題》中的第一題),在fork的時候,快取被複制到了子程式空間,所以,就多了兩個,就成了8個,而不是6個。
另外,多說一下,我們知道,Unix下的裝置有“塊裝置”和“字元裝置”的概念,所謂塊裝置,就是以一塊一塊的資料存取的裝置,字元裝置是一次存取一個字元的裝置。磁碟、記憶體都是塊裝置,字元裝置如鍵盤和串列埠。塊裝置一般都有快取,而字元裝置一般都沒有快取。
對於上面的問題,我們如果修改一下上面的printf的那條語句為:
1 |
printf("-\n"); |
或是
1 2 |
printf("-"); fflush(stdout); |
就沒有問題了(就是6個“-”了),因為程式遇到“\n”,或是EOF,或是緩中區滿,或是檔案描述符關閉,或是主動flush,或是程式退出,就會把資料刷出緩衝區。需要注意的是,標準輸出是行緩衝,所以遇到“\n”的時候會刷出緩衝區,但對於磁碟這個塊裝置來說,“\n”並不會引起緩衝區刷出的動作,那是全緩衝,你可以使用setvbuf來設定緩衝區大小,或是用fflush刷快取。
我估計有些朋友可能對於fork()還不是很瞭解,那麼我們把上面的程式改成下面這樣:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); //注意:下面的printf有“n” printf("ppid=%d, pid=%d, i=%d n", getppid(), getpid(), i); } sleep(10); //讓程式停留十秒,這樣我們可以用pstree檢視一下程式樹 return 0; } |
於是,上面這段程式會輸出下面的結果,(注:編譯出的可執行的程式名為fork)
1 2 3 4 5 6 7 8 9 |
ppid=8858, pid=8518, i=0 ppid=8858, pid=8518, i=1 ppid=8518, pid=8519, i=0 ppid=8518, pid=8519, i=1 ppid=8518, pid=8520, i=1 ppid=8519, pid=8521, i=1 $ pstree -p | grep fork |-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521) |
面對這樣的圖你可能還是看不懂,沒事,我好事做到底,畫個圖給你看看:
注意:上圖中的我用了幾個色彩,相同顏色的是同一個程式。於是,我們的pstree的圖示就可以成為下面這個樣子:(下圖中的顏色與上圖對應)
這樣,對於printf(“-”);這個語句,我們就可以很清楚的知道,哪個子程式複製了父程式標準輸出緩中區裡的的內容,而導致了多次輸出了。(如下圖所示,就是我陰影並雙邊框了那兩個子程式)
現在你明白了吧。(另,對於圖中的我本人拙劣的配色,請見諒!)