Linux核心分析方法(轉)

ba發表於2007-08-16
Linux核心分析方法(轉)[@more@]想入手分析Linux原始碼的Linuxer,我想這篇文章可能對你會有些幫助的。我也在分析記憶體管理部分,歡迎交流,共同進步。[力量雖少,但希望早日實現在Linux核心裡有一行程式碼是我們中國人寫的]

--------------------------------------------------------------------------------

Linux的最大的好處之一就是它的原始碼公開。同時,公開的核心原始碼也吸引著無數的電腦愛好者和程式設計師;他們把解讀和分析Linux的核心原始碼作為自己的最大興趣,把修改Linux原始碼和改造Linux系統作為自己對計算機技術追求的最大目標。

Linux核心原始碼是很具吸引力的,特別是當你弄懂了一個分析了好久都沒搞懂的問題;或者是被你修改過了的核心,順利透過編譯,一切執行正常的時候。那種成就感真是油然而生!而且,對核心的分析,除了出自對技術的狂熱追求之外,這種令人生畏的勞動所帶來的回報也是非常令人著迷的,這也正是它擁有眾多追隨者的主要原因:

首先,你可以從中學到很多的計算機的底層知識,如後面將講到的系統的引導和硬體提供的中斷機制等;其它,象虛擬儲存的實現機制,多工機制,系統保護機制等等,這些都是非都原始碼不能體會的。

同時,你還將從作業系統的整體結構中,體會整體設計在軟體設計中的份量和作用,以及一些宏觀設計的方法和技巧:Linux的核心為上層應用提供一個與具體硬體不相關的平臺;同時在核心內部,它又把程式碼分為與體系結構和硬體相關的部分,和可移植的部分;再例如,Linux雖然不是微核心的,但他把大部分的裝置驅動處理成相對獨立的核心模組,這樣減小了核心執行的開銷,增強了核心程式碼的模組獨立性。

而且你還能從對核心原始碼的分析中,體會到它在解決某個具體細節問題時,方法的巧妙:如後面將分析到了的Linux透過Botoom_half機制來加快系統對中斷的處理。

最重要的是:在原始碼的分析過程中,你將會被一點一點地、潛移默化地專業化。一個專業的程式設計師,總是把程式碼的清晰性,相容性,可移植性放在很重要的位置。他們總是透過定義大量的宏,來增強程式碼的清晰度和可讀性,而又不增加編譯後的程式碼長度和程式碼的執行效率;他們總是在編碼的同時,就考慮到了以後的程式碼維護和升級。 甚至,只要分析百分之一的程式碼後,你就會深刻地體會到,什麼樣的程式碼才是一個專業的程式設計師寫的,什麼樣的程式碼是一個業餘愛好者寫的。而這一點是任何沒有真正分析過標準程式碼的人都無法體會到的。

然而,由於核心程式碼的冗長,和核心體系結構的龐雜,所以分析核心也是一個很艱難,很需要毅力的事;在缺乏指導和交流的情況下,尤其如此。只有方法正確,才能事半功倍。正是基於這種考慮,作者希望透過此文能給大家一些借鑑和啟迪。

由於本人所進行的分析都是基於2.2.5版本的核心;所以,如果沒有特別說明,以下分析都是基於i386單處理器的2.2.5版本的Linux核心。所有原始檔均是相對於目錄/usr/src/linux的。

方法之一:從何入手

要分析Linux核心原始碼,首先必須找到各個模組的位置,也即要弄懂原始碼的檔案組織形式。雖然對於有經驗的高手而言,這個不是很難;但對於很多初級的Linux愛好者,和那些對原始碼分析很有興趣但接觸不多的人來說,這還是很有必要的。

1、Linux核心源程式通常都安裝在/usr/src/linux下,而且它有一個非常簡單的編號約定:任何偶數的核心(的二個數為偶數,例如2.0.30)都是一個穩定地發行的核心,而任何奇數的核心(例如2.1.42)都是一個開發中的核心。

2、核心源程式的檔案按樹形結構進行組織,在源程式樹的最上層,即目錄/usr/src/linux下有這樣一些目錄和檔案:

◆ COPYING: GPL版權申明。對具有GPL版權的原始碼改動而形成的程式,或使用GPL工具產生的程式,具有使用GPL發表的義務,如公開原始碼;

◆ CREDITS: 光榮榜。對Linux做出過很大貢獻的一些人的資訊;

◆ MAINTAINERS: 維護人員列表,對當前版本的核心各部分都有誰負責;

◆ Makefile: 第一個Makefile檔案。用來組織核心的各模組,記錄了個模組間的相互這間的聯絡和依託關係,編譯時使用;仔細閱讀各子目錄下的Makefile檔案對弄清各個檔案這間的聯絡和依託關係很有幫助;

◆ ReadMe: 核心及其編譯配置方法簡單介紹;

◆ Rules.make: 各種Makefilemake所使用的一些共同規則;

◆ REPORTING-BUGS:有關報告Bug 的一些內容;

● Arch/ :arch子目錄包括了所有和體系結構相關的核心程式碼。它的每一個子目錄都代表一種支援的體系結構,例如i386就是關於intel cpu及與之相相容體系結構的子目錄。PC機一般都基於此目錄;

● Include/: include子目錄包括編譯核心所需要的大部分標頭檔案。與平臺無關的標頭檔案在 include/linux子目錄下,與 intel cpu相關的標頭檔案在include/asm-i386子目錄下,而include/scsi目錄則是有關scsi裝置的標頭檔案目錄;

● Init/: 這個目錄包含核心的初始化程式碼(注:不是系統的引導程式碼),包含兩個檔案main.c和Version.c,這是研究核心如何工作的好的起點之一。

● Mm/:這個目錄包括所有獨立於 cpu 體系結構的記憶體管理程式碼,如頁式儲存管理記憶體的分配和釋放等;而和體系結構相關的記憶體管理程式碼則位於arch/*/mm/,例如arch/i386/mm/Fault.c;

● Kernel/:主要的核心程式碼,此目錄下的檔案實現了大多數linux系統的核心函式,其中最重要的檔案當屬sched.c;同樣,和體系結構相關的程式碼在arch/*/kernel中;

● Drivers/: 放置系統所有的裝置驅動程式;每種驅動程式又各佔用一個子目錄:如,/block 下為塊裝置驅動程式,比如ide(ide.c)。如果你希望檢視所有可能包含檔案系統的裝置是如何初始化的,你可以看drivers/block/genhd.c中的device_setup()。它不僅初始化硬碟,也初始化網路,因為安裝nfs檔案系統的時候需要網路;

● Documentation/: 文件目錄,沒有核心程式碼,只是一套有用的文件,可惜都是English的,看看應該有用的哦;

● Fs/: 所有的檔案系統程式碼和各種型別的檔案操作程式碼,它的每一個子目錄支援一個檔案系統, 例如fat和ext2;

● Ipc/: 這個目錄包含核心的程式間通訊的程式碼;

● Lib/: 放置核心的庫程式碼;

● Net/: 核心與網路相關的程式碼;

● Modules/: 模組檔案目錄,是個空目錄,用於存放編譯時產生的模組目標檔案;

● Scripts/: 描述檔案,指令碼,用於對核心的配置;

一般,在每個子目錄下,都有一個 Makefile 和一個Readme 檔案,仔細閱讀這兩個檔案,對核心原始碼的理解很有用。

對Linux核心原始碼的分析,有幾個很好的入口點:一個就是系統的引導和初始化,即從機器加電到系統核心的執行;另外一個就是系統呼叫,系統呼叫是使用者程式或操作呼叫核心所提供的功能的介面。對於那些對硬體比較熟悉的愛好者,從系統的引匯入手進行分析,可能來的容易一些;而從系統呼叫下手,則可能更合適於那些在dos或Uinx、Linux下有過C程式設計經驗的高手。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10617731/viewspace-961470/,如需轉載,請註明出處,否則將追究法律責任。

相關文章