Linux從頭學05-系統啟動過程中的幾個神祕地址,你知道是什麼意思嗎?

IOT物聯網小鎮發表於2021-08-03

作 者:道哥,10+年的嵌入式開發老兵。

公眾號:【IOT物聯網小鎮】,專注於:C/C++、Linux作業系統、應用程式設計、物聯網、微控制器和嵌入式開發等領域。 公眾號回覆【書籍】,獲取 Linux、嵌入式領域經典書籍。

轉 載:歡迎轉載文章,轉載需註明出處。

在第一篇文章中,我們就提到,現代作業系統是從最古老的 8086 系統一步一步發展而來的。

處理器廠商為了向後相容,很多底層相關的原理都是一樣的(如果不相容,就會丟棄市場份額)。

特別是從系統上電之後,一直到作業系統中第一個程式(Linux 下就是 init 程式)執行起來,這其中經歷了 BIOS、載入程式、作業系統這三元大將的接力跑。

今天,我們從幾個特殊的地址的角度,來從巨集觀節點上看一下系統的啟動過程。

0xFFFF:0x0000

這個地址,是處理器上電之後的第一個重要的實體地址。

從地址的書寫形式上,就可以看出這是 8086 系統中真實模式下的段定址方式:段地址 * 16 + 偏移量

段地址:0xFFFF

偏移地址:0x0000

計算得到實體地址:0xFFFF0

當處理器的 reset 引腳被觸發後,處理器首先進行硬體初始化,也就是把處理器內部的每個暫存器都設定為一個初始的預設狀態

把段暫存器 cs 設定為 0xFFFF,指令暫存器 ip 設定為 0x0000;

把其它的所有暫存器設定為 0x0000;

當所有的初始化完成之後,CPU 就開始執行第一條指令。

之前說過,CPU 是很傻、很單純的,它只知道去 cs:ip 所指向的地址處,取出一條指令,執行完之後,再取出下一條指令繼續執行。。。

每一條指令的第一個位元組都是操作碼,CPU 根據操作碼,能夠知道當前指令的位元組長度,並把 ip 暫存器指向下一條指令。

既然硬體初始化時,已經把 cs 初始化為 0xFFFF,把 ip 初始化為 0x0000,經過段定址的公式計算之後,就得到了實體地址0xFFFF0,也就是說,CPU 執行的第一條指令位於實體地址 0xFFFF0 這個地方。

那麼,這個實體地址中,存放著什麼指令呢?

首先來複習一下地址範圍的相關知識:

8086 處理器有 20 根地址線,定址範圍是:0x00000 ~ 0xFFFFF,最大就是 1 MB。

但是 8086 的處理器是 16 位的,暫存器最大表示的範圍是 0xFFFF,也就是 64 KB。

採用【段基址:偏移量】來表示一個段時,這個段的最大偏移範圍就是 64 KB。

我們再回到系統的啟動流程。

在上電之後,硬體會把一個 ROM 晶片,對映到記憶體地址空間的最高地址空間,也即是 1 MB 的位置,如圖:

ROM 晶片中存放的就是 BIOS 程式碼,稱作:基本輸入輸出系統(Basic Input/Output System)。

此時,cs:ip 計算得到的實體地址為 0xFFFF0,正好落在對映到 ROM 的這塊記憶體空間。

因此,從這個地址中獲取到指令,其實就是從 ROM 中讀取的

所謂的對映:就是訪問某個地址空間中的內容時,就會自動定位到被對映的目標物理裝置中進行訪問,這是由硬體來保證的。

CPU 在執行指令的時候,ip 暫存器是遞增的,也就是說會從地址到地址,依次執行每一條指令。

但是此時第一條指令的地址就是 0xFFFF0,已經快接近 1 MB 地址空間的頂端了,只有 16 個位元組的地址空間。

如果執行到頂端,溢位之後,就會迴繞到最低地址 0x00000

因此,在這個第一條指令的位置處,是一條跳轉指令

跳轉目標是 0xF000:0xE05B,計算得到實體地址 0xFE05B,可以看到同樣是落在對映到 ROM 的地址空間中(好像是廢話:此時只能執行 BIOS 中的程式碼)。

0xF000:0xE05B

這個地址處的程式碼,才是 BIOS 真正開始執行的地方。BIOS 所做的事情包括:

偵測硬體裝置:系統中有哪些硬體裝置,工作狀態是什麼;

對硬體裝置進行初始化:比如最初始的中斷向量表;

偵測作業系統啟動裝置:選擇好一個系統盤之後,把系統盤中主引導扇區中的載入程式讀取到記憶體中;

BIOS 的最後一個步驟中,它把載入程式讀取到記憶體中 0x0000:0x7C00 地址處,計算得到實體地址就是:0x07C00

這個地址的記憶體空間,被硬體對映到 RAM 晶片中

具體的說就是,硬體把記憶體空間 0x00000 ~ 0x9FFFF 對映到隨機儲存器中,一共是 640 KB 的空間。

注意:雖然地址空間有 640 KB 這麼大,但是實際的 RAM 大小可能只有可憐的 32 KB,因此實際可用的空間取決於物理晶片。

中間空著的那塊地址空間,對映到一些外設。

0x0000:0x7C00

這個地址,就是作業系統的引導程式碼被讀取到記憶體中的地方。

在記憶體地址的剛開始位置(0x00000~0x003FF),存放著中斷向量表

可以看到:作業系統引導程式碼並沒有從中斷向量表之後的 0x00400 開始存放,而是被放在了 0x07C00 這個地方:

至於為什麼要這麼放置,有很多的說法,比較靠譜的解釋是這樣的:

假如實際的 RAM 晶片只有 32 KB(不要用現代的眼光來看,在 N久 之前,RAM 還是非常的珍貴),那麼記憶體佈局就是這樣:

在此也鄙視一下現在很多的應用軟體,動不動就佔用那麼多的記憶體,都以為整個電腦只為它一家軟體服務的?!

可以看到,引導程式碼幾乎位於 RAM 的頂端了,這樣的話,從中斷向量開始的 0x00400,一直到引導程式碼的 0x07C00,這塊地址空間就是連續的一整塊,可以被作業系統更方便的操作。

另外,把引導程式碼放在 RAM高地址處,還有一個好處:

當引導程式碼最終把接力棒交給作業系統之後,引導程式碼就沒有任何用處了。

因此,作業系統就可以直接把引導程式碼所在的地址空間中內容,全部抹掉,為自己所用!


------ End ------

推薦閱讀

【1】C語言指標-從底層原理到花式技巧,用圖文和程式碼幫你講解透徹
【2】一步步分析-如何用C實現物件導向程式設計
【3】原來gdb的底層除錯原理這麼簡單
【4】內聯彙編很可怕嗎?看完這篇文章,終結它!

其他系列專輯精選文章C語言Linux作業系統應用程式設計物聯網

星標公眾號,能更快找到我!

相關文章