Linux記憶體定址之分段機制

Yonah-瀟發表於2016-05-10

前言

最近在學習Linux核心,讀到《深入理解Linux核心》的記憶體定址一章。原本以為自己對分段分頁機制已經理解了,結果發現其實是一知半解。於是,查詢了很多資料,最終理順了記憶體定址的知識。現在把我的理解記錄下來,希望對核心學習者有一定幫助,也希望大家指出錯誤之處。

分段到底是怎麼回事

相信學過作業系統課程的人都知道分段分頁,但是奇怪的是書上基本沒提分段分頁是怎麼產生的,這就導致我們知其然不知其所以然。下面我們先扒一下分段機制產生的歷史。

真實模式的誕生(16位處理器及定址)

在8086處理器誕生之前,記憶體定址方式就是直接訪問實體地址。8086處理器為了定址1M的記憶體空間,把地址匯流排擴充套件到了20位。但是,一個尷尬的問題出現了,ALU的寬度只有16位,也就是說,ALU不能計算20位的地址。為了解決這個問題,分段機制被引入,登上了歷史舞臺。

為了支援分段,8086處理器設定了四個段暫存器:CS, DS, SS, ES.每個段暫存器都是16位的,同時訪問記憶體的指令中的地址也是16位的。但是,在送入地址匯流排之前,CPU先把它與某個段暫存器內的值相加。這裡要注意:段暫存器的值對應於20位地址匯流排的中的高16位,所以相加時實際上是16位記憶體地址(即段內偏移值)的高12位與段暫存器中的16位相加,而低4位保留不變,這樣就形成一個20位的實際地址,也就實現了從16位記憶體地址到20位實際地址的轉換,或者叫“對映”。

上面關於分段機制計算記憶體地址的描述比較難理解,畫了一個圖幫助理解

+-----------------+
|       20        |  20位地址匯流排
+-----------------+
+------------+
|      16    |       16位段地址
+------------+
    +-------------+
    |    12  | 4  |  16位記憶體地址(段內偏移量)
    +--------+----+

實際實體地址 = (段暫存器地址 << 4) + (CPU 提交的訪存地址)

保護模式的誕生(32位處理器及定址)

  • 80286處理器的地址匯流排為24位,定址空間達16M,同時引入了保護模式(記憶體段的訪問受到限制)
  • 80386處理器是一個32位處理器,ALU和地址匯流排都是32位的,定址空間達 4G。也就是說它可以不通過分段機制,直接訪問4G的記憶體空間。雖然它是新時代的小王子,超越它的無數前輩,然而,它需要揹負家族的使命–相容前代的處理器。也就是說,它必須支援真實模式和保護模式。所以,80386在段暫存器的基礎上構築保護模式,並且保留16位的段暫存器。
  • 從80386之後的處理器,架構基本相似,統稱為IA32(32 Bit Intel Architecture)。

IA32的記憶體定址機制

定址硬體

在 8086 的真實模式下,把某一段暫存器左移4位,然後與地址ADDR相加後被直接送到記憶體匯流排上,這個相加後的地址就是記憶體單元的實體地址,而程式中的這個地址就叫邏輯地址(或叫虛地址)。在IA32的保護模式下,這個邏輯地址不是被直接送到記憶體匯流排而是被送到記憶體管理單元(MMU)。MMU由一個或一組晶片組成,其功能是把邏輯地址對映為實體地址,即進行地址轉換,如圖所示。

MMU

IA32的三種地址

  • 邏輯地址:
    機器語言指令仍用這種地址指定一個運算元的地址或一條指令的地址。 這種定址方式在Intel的分段結構中表現得尤為具體,它使得MS-DOS或Windows程式設計師把程式分為若干段。每個邏輯地址都由一個段和偏移量組成。
  • 線性地址:
    線性地址是一個32位的無符號整數,可以表達高達232(4GB)的地址。通常用16進製表示線性地址,其取值範圍為0×00000000~0xffffffff。
  • 實體地址:
    也就是記憶體單元的實際地址,用於晶片級記憶體單元定址。 實體地址也由32位無符號整數表示。

MMU地址轉化過程

MMU是一種硬體電路,它包含兩個部件,一個是分段部件,一個是分頁部件,在此,我們把它們分別叫做分段機制和分頁機制,以利於從邏輯的角度來理解硬體的實現機制。分段機制把一個邏輯地址轉換為線性地址;接著,分頁機制把一個線性地址轉換為實體地址。

MMU_translate

IA32的段暫存器

IA32中有六個16位段暫存器:CS, DS, SS, ES,FS, GS.跟8086的段暫存器不同的是,這些暫存器存放的不再是某個段的基地址,而是某個段的選擇符(Selector)。

分段機制的實現

段是虛擬地址空間的基本單位,分段機制必須把虛擬地址空間的一個地址轉換為線性地址空間的一個線性地址。

為了實現這種對映,僅僅用段暫存器來確定一個基地址是不夠的,至少還得描述段的長度,並且還需要段的一些其他資訊,比如訪問權之類。所以,這裡需要的是一個資料結構,這個結構包括三個方面的內容:

  1. 段的基地址(Base Address):線上性地址空間中段的起始地址。
  2. 段的界限(Limit):在虛擬地址空間中,段內可以使用的最大偏移量。
  3. 段的保護屬性(Attribute):表示段的特性。例如,該段是否可被讀出或寫入,或者該段是否作為一個程式來執行,以及段的特權級等等。

上面的資料結構我們稱為段描述符,多個段描述符組成的表稱為段描述符表

段描述符

所謂描述符(Descriptor),就是描述段的屬性的一個8位元組儲存單元。在真實模式下,段的屬性不外乎是程式碼段、堆疊段、資料段、段的起始地址、段的長度等等,而在保護模式下則複雜一些。IA32將它們結合在一起用一個8位元組的數表示,稱為描述符 。

IA32的一個通用的段描述符的結構

從圖可以看出,一個段描述符指出了段的32位基地址和20位段界限(即段長)。這裡我們只關注基地址和段界限,其他的屬性略過。

段描述符表

各種各樣的使用者描述符和系統描述符,都放在對應的全域性描述符表、區域性描述符表和中斷描述符表中。描述符表(即段表)定義了IA32系統的所有段的情況。所有的描述符表本身都佔據一個位元組為8的倍數的儲存器空間,空間大小在8個位元組(至少含一個描述符)到64K位元組(至多含8K)個描述符之間。

  1. 全域性描述符表(GDT)
    全域性描述符表GDT(Global Descriptor Table),除了任務門,中斷門和陷阱門描述符外,包含著系統中所有任務都共用的那些段的描述符。 它的第一個8位元組位置沒有使用。
  2. 中斷描述符表IDT(Interrupt Descriptor Table)
    中斷描述符表IDT(Interrupt Descriptor Table),包含256個門描述符。IDT中只能包含任務門、中斷門和陷阱門描述符,雖然IDT表最長也可以為64K位元組,但只能存取2K位元組以內的描述符,即256個描述符,這個數字是為了和8086保持相容。
  3. 區域性描述符表(LDT)
    區域性描述符表LDT(local Descriptor Table),包含了與一個給定任務有關的描述符,每個任務各自有一個的LDT。 有了LDT,就可以使給定任務的程式碼、 資料與別的任務相隔離。每一個任務的區域性描述符表LDT本身也用一個描述符來表示,稱為LDT描述符,它包含了有關區域性描述符表的資訊,被放在全域性描述符表GDT中。

總結

IA32的記憶體定址機制完成從邏輯地址–線性地址–實體地址的轉換。其中,邏輯地址的段暫存器中的值提供段描述符,然後從段描述符中得到段基址和段界限,然後加上邏輯地址的偏移量,就得到了線性地址,線性地址通過分頁機制得到實體地址。
首先,我們要明確,分段機制是IA32提供的定址方式,這是硬體層面的。就是說,不管你是windows還是linux,只要使用IA32的CPU訪問記憶體,都要經過MMU的轉換流程才能得到實體地址,也就是說必須經過邏輯地址–線性地址–實體地址的轉換。

Linux中分段的實現

前面說了那麼多關於分段機制的實現,其實,對於Linux來說,並沒有什麼卵用。因為,Linux基本不使用分段的機制,或者說,Linux中的分段機制只是為了相容IA32的硬體而設計的。

Intel微處理器的段機制是從8086開始提出的, 那時引入的段機制解決了從CPU內部16位地址到20位實地址的轉換。為了保持這種相容性,386仍然使用段機制,但比以前複雜得多。因此,Linux核心的設計並沒有全部採用Intel所提供的段方案,僅僅有限度地使用了一下分段機制。這不僅簡化了Linux核心的設計,而且為把Linux移植到其他平臺創造了條件,因為很多RISC處理器並不支援段機制。但是,對段機制相關知識的瞭解是進入Linux核心的必經之路。

從2.2版開始,Linux讓所有的程式(或叫任務)都使用相同的邏輯地址空間,因此就沒有必要使用區域性描述符表LDT。但核心中也用到LDT,那只是在VM86模式中執行Wine,因為就是說在Linux上模擬執行Winodws軟體或DOS軟體的程式時才使用。

在 IA32 上任意給出的地址都是一個虛擬地址,即任意一個地址都是通過“選擇符:偏移量”的方式給出的,這是段機制存訪問模式的基本特點。所以在IA32上設計作業系統時無法迴避使用段機制。一個虛擬地址最終會通過“段基地址+偏移量”的方式轉化為一個線性地址。 但是,由於絕大多數硬體平臺都不支援段機制,只支援分頁機制,所以為了讓 Linux 具有更好的可移植性,我們需要去掉段機制而只使用分頁機制。但不幸的是,IA32規定段機制是不可禁止的,因此不可能繞過它直接給出線性地址空間的地址。萬般無奈之下,Linux的設計人員乾脆讓段的基地址為0,而段的界限為4GB,這時任意給出一個偏移量,則等式為“0+偏移量=線性地址”,也就是說“偏移量=線性地址”。另外由於段機制規定“偏移量<4GB”,所以偏移量的範圍為0H~FFFFFFFFH,這恰好是線性地址空間範圍,也就是說虛擬地址直接對映到了線性地址,我們以後所提到的虛擬地址和線性地址指的也就是同一地址。看來,Linux在沒有迴避段機制的情況下巧妙地把段機制給繞過去了。

另外,由於IA32段機制還規定,必須為程式碼段和資料段建立不同的段,所以Linux必須為程式碼段和資料段分別建立一個基地址為0,段界限為4GB的段描述符。不僅如此,由於Linux核心執行在特權級0,而使用者程式執行在特權級別3,根據IA32段保護機制規定,特權級3的程式是無法訪問特權級為0的段的,所以Linux必須為核心使用者程式分別建立其程式碼段和資料段。這就意味著Linux必須建立4個段描述符——特權級0的程式碼段和資料段,特權級3的程式碼段和資料段。

總結

分段機制是IA32架構CPU的特色,並不是作業系統定址方式的必然選擇。Linux為了跨平臺,巧妙的繞開段機制,主要使用分頁機制來定址。

相關文章