解讀Linux程式

安全劍客發表於2018-11-05
計算機實際上可以做的事情實質上非常簡單,比如計算兩個數的和,再比如在記憶體中尋找到某個地址等等。這些最基礎的計算機動作被稱為指令(instruction)。所謂的程式(program),就是這樣一系列指令的所構成的集合。透過程式,我們可以讓計算機完成複雜的操作。程式大多數時候被儲存為可執行的檔案。這樣一個可執行檔案就像是一個菜譜,計算機可以按照菜譜作出可口的飯菜。

程式和程式(process)的區別是什麼呢?

程式是程式的一個具體實現。只有食譜沒什麼用,我們總要按照食譜的指點真正一步步實行,才能做出菜餚。程式是執行程式的過程,類似於按照食譜,真正去做菜的過程。同一個程式可以執行多次,每次都可以在記憶體中開闢獨立的空間來裝載,從而產生多個程式。不同的程式還可以擁有各自獨立的IO介面。

作業系統的一個重要功能就是為程式提供方便,比如說為程式分配記憶體空間,管理程式的相關資訊等等,就好像是為我們準備好了一個精美的廚房。

程式

首先,我們可以使用$ps命令來查詢正在執行的程式,比如$ps -eo pid,comm,cmd,下圖為執行結果:

(-e表示列出全部程式,-o pid,comm,cmd表示我們需要PID,COMMAND,CMD資訊)

解讀Linux程式解讀Linux程式

每一行代表了一個程式。每一行又分為三列。第一列PID(process IDentity)是一個整數,每一個程式都有一個唯一的PID來代表自己的身份,程式也可以根據PID來識別其他的程式。第二列COMMAND是這個程式的簡稱。第三列CMD是程式所對應的程式以及執行時所帶的引數。

(第三列有一些由中括號[]括起來的。它們是核心的一部分功能,被打扮成程式的樣子以方便作業系統管理。我們不必考慮它們。)

我們看第一行,PID為1,名字為init。這個程式是執行/bin/init這一檔案(程式)生成的。當 啟動的時候,init是系統建立的第一個程式,這一程式會一直存在,直到我們關閉計算機。這一程式有特殊的重要性,我們會不斷提到它。

如何建立一個程式

實際上,當計算機開機的時候,核心(kernel)只建立了一個init程式。Linux核心並不提供直接建立新程式的系統呼叫。剩下的所有程式都是init程式透過fork機制建立的。新的程式要透過老的程式複製自身得到,這就是fork。fork是一個系統呼叫。程式存活於記憶體中。每個程式都在記憶體中分配有屬於自己的一片空間 (address space)。當程式fork的時候,Linux在記憶體中開闢出一片新的記憶體空間給新的程式,並將老的程式空間中的內容複製到新的空間中,此後兩個程式同時執行。

老程式成為新程式的父程式(parent process),而相應的,新程式就是老的程式的子程式(child process)。一個程式除了有一個PID之外,還會有一個PPID(parent PID)來儲存的父程式PID。如果我們循著PPID不斷向上追溯的話,總會發現其源頭是init程式。所以說,所有的程式也構成一個以init為根的樹狀結構。

如下,我們查詢當前shell下的程式:

 class="">root@vamei:~# ps -o pid,ppid,cmd PID  PPID CMD16935  3101 sudo -i16939 16935 -bash23774 16939 ps -o pid,ppid,cmd

我們可以看到,第二個程式bash是第一個程式sudo的子程式,而第三個程式ps是第二個程式的子程式。

還可以用$pstree命令來顯示整個程式樹:

 class="">init─┬─NetworkManager─┬─dhclient
    │                └─2*[{NetworkManager}]    ├─accounts-daemon───{accounts-daemon}
    ├─acpid
    ├─apache2─┬─apache2
    │         └─2*[apache2───26*[{apache2}]]
    ├─at-spi-bus-laun───2*[{at-spi-bus-laun}]    ├─atd
    ├─avahi-daemon───avahi-daemon
    ├─bluetoothd
    ├─colord───2*[{colord}]    ├─console-kit-dae───64*[{console-kit-dae}]    ├─cron
    ├─cupsd───2*[dbus]    ├─2*[dbus-daemon]    ├─dbus-launch
    ├─dconf-service───2*[{dconf-service}]    ├─dropbox───15*[{dropbox}]    ├─firefox───27*[{firefox}]    ├─gconfd-2
    ├─geoclue-master
    ├─6*[getty]    ├─gnome-keyring-d───7*[{gnome-keyring-d}]    ├─gnome-terminal─┬─bash
    │                ├─bash───pstree
    │                ├─gnome-pty-helpe
    │                ├─sh───R───{R}
    │                └─3*[{gnome-terminal}]

fork通常作為一個函式被呼叫。這個函式會有兩次返回,將子程式的PID返回給父程式,0返回給子程式。實際上,子程式總可以查詢自己的PPID來知道自己的父程式是誰,這樣,一對父程式和子程式就可以隨時查詢對方。

通常在呼叫fork函式之後,程式會設計一個if選擇結構。當PID等於0時,說明該程式為子程式,那麼讓它執行某些指令,比如說使用exec庫函式(library function)讀取另一個程式檔案,並在當前的程式空間執行 (這實際上是我們使用fork的一大目的: 為某一程式建立程式);而當PID為一個正整數時,說明為父程式,則執行另外一些指令。由此,就可以在子程式建立之後,讓它執行與父程式不同的功能。

子程式的終結(termination)

當子程式終結時,它會通知父程式,並清空自己所佔據的記憶體,並在核心裡留下自己的退出資訊(exit code,如果順利執行,為0;如果有錯誤或異常狀況,為>0的整數)。在這個資訊裡,會解釋該程式為什麼退出。父程式在得知子程式終結時,有責任對該子程式使用wait系統呼叫。這個wait函式能從核心中取出子程式的退出資訊,並清空該資訊在核心中所佔據的空間。但是,如果父程式早於子程式終結,子程式就會成為一個孤兒(orphand)程式。孤兒程式會被過繼給init程式,init程式也就成了該程式的父程式。init程式負責該子程式終結時呼叫wait函式。

當然,一個糟糕的程式也完全可能造成子程式的退出資訊滯留在核心中的狀況(父程式不對子程式呼叫wait函式),這樣的情況下,子程式成為殭屍(zombie)程式。當大量殭屍程式積累時,記憶體空間會被擠佔。

程式與執行緒(thread)

儘管在UNIX中,程式與執行緒是有聯絡但不同的兩個東西,但在Linux中,執行緒只是一種特殊的程式。多個執行緒之間可以共享記憶體空間和IO介面。所以,程式是Linux程式的唯一的實現方式。

總結

程式,程式,PID,記憶體空間

子程式,父程式,PPID,fork, wait


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31559985/viewspace-2218697/,如需轉載,請註明出處,否則將追究法律責任。

相關文章