【JVM進階之路】十三:類載入過程

三分惡發表於2021-05-27

通過前面的學習,我們瞭解了Class檔案的結構,在Class檔案中描述的各類資訊,最終都需要載入到虛擬機器中之後才能被執行和使用。

接下來,我們開始學習JVM的類載入。

一個類從被載入到虛擬機器記憶體中開始,到從記憶體中解除安裝,整個生命週期需要經過七個階段:載入 (Loading)、驗證(Verification)、準備(Preparation)、解析(Resolution)、初始化 (Initialization)、使用(Using)和解除安裝(Unloading),其中驗證、準備、解析三個部分統稱為連線(Linking)。

類的生命週期

《Java虛擬機器規範》 嚴格規定了有且只有六種情況必須立即對類進行“初始化”:

  • 1)遇到new、getstatic、putstatic或invokestatic這四條位元組碼指令時,如果型別沒有進行過初始化,則需要先觸發其初始化階段。
  • 2)使用java.lang.reflect包的方法對型別進行反射呼叫的時候,如果型別沒有進行過初始化,則需要先觸發其初始化。
  • 3)當初始化類的時候,如果發現其父類還沒有進行過初始化,則需要先觸發其父類的初始化。
  • 4)當虛擬機器啟動時,使用者需要指定一個要執行的主類(包含main()方法的那個類),虛擬機器會先初始化這個主類。
  • 5)當使用JDK 7新加入的動態語言支援時,如果一個java.lang.invoke.MethodHandle例項最後的解析結果為REF_getStatic、REF_putStatic、REF_invokeStatic、REF_newInvokeSpecial四種型別的方法控制程式碼,並且這個方法控制程式碼對應的類沒有進行過初始化,則需要先觸發其初始化。
  • 6)當一個介面中定義了JDK 8新加入的預設方法(被default關鍵字修飾的介面方法)時,如果有這個介面的實現類發生了初始化,那該介面要在其之前被初始化。

這六種場景中的行為稱為對一個型別進行主動引用。

接下來我們來詳細學習Java虛擬機器中類載入的全過程,即載入、驗證、準備、解析和初始化。

1、載入

載入是JVM載入的起點,具體什麼時候開始載入,《Java虛擬機器規範》中並沒有進行強制約束,可以交給虛擬機器的具體實現來自由把握。

在載入過程,JVM要做三件事情:

載入

  • 1)通過一個類的全限定名來獲取定義此類的二進位制位元組流。

  • 2)將這個位元組流所代表的靜態儲存結構轉化為方法區的執行時資料結構。

  • 3)在記憶體中生成一個代表這個類的java.lang.Class物件,作為方法區這個類的各種資料的訪問入口。

載入階段結束後,Java虛擬機器外部的二進位制位元組流就按照虛擬機器所設定的格式儲存在方法區之中了,方法區中的資料儲存格式完全由虛擬機器實現自行定義,《Java虛擬機器規範》未規定此區域的具體資料結構。

型別資料妥善安置在方法區之後,會在Java堆記憶體中例項化一個java.lang.Class類的物件, 這個物件將作為程式訪問方法區中的型別資料的外部介面。

方法區在JDK不同版本的具體實現就不再詳細說了。在JDK1.8中,型別資料儲存在元空間中。

2、驗證

驗證是連線階段的第一步,這一階段的目的是確保Class檔案的位元組流中包含的資訊符合《Java虛擬機器規範》的全部約束要求。

驗證階段大致上會完成下面四個階段的檢驗動作:檔案格式驗證、後設資料驗證、位元組碼驗證和符號引用驗證。

驗證階段

  • 檔案格式驗證

第一階段要驗證位元組流是否符合Class檔案格式的規範,並且能被當前版本的虛擬機器處理。需要驗證魔數、版本號、常量池常量型別是否支援、指向常量的索引值等等。

  • 後設資料驗證

第二階段是對位元組碼描述的資訊進行語義分析,以保證其描述的資訊符合《Java語言規範》的要求,包括類是否有父類、父類是否繼承了final修飾的類、非抽象類是否實現了父類定義的方法、類是否與父類有矛盾等等。

  • 位元組碼驗證

第三階段是整個驗證過程中最複雜的一個階段,主要目的是通過資料流分析和控制流分析,確定程式語義是合法的、符合邏輯的。

  • 符號引用驗證

最後一個階段的校驗行為發生在虛擬機器將符號引用轉化為直接引用的時候,這個轉化動作將在連線的第三階段——解析階段中發生。

符號引用驗證主要驗證類是否缺少或者被禁止訪問它依賴的某些外部類、方法、欄位等資源。

3、準備

準備階段是給靜態變數分配記憶體並設定類變數初始值的階段。

在JDK 7及之前,這些變數的記憶體在方法區(永久代)中分配,在JDK 8及之後,靜態變數則會隨著Class物件一起存放在Java堆中。

準備

4、解析

解析階段是Java虛擬機器將常量池內的符號引用替換為直接引用的過程。

  • 符號引用(Symbolic References):符號引用以一組符號來描述所引用的目標,符號可以是任何形式的字面量,只要使用時能無歧義地定位到目標即可。
  • 直接引用(Direct References):直接引用是可以直接指向目標的指標、相對偏移量或者是一個能間接定位到目標的控制程式碼。

解析過程

5、初始化

類的初始化階段是類載入過程的最後一個步驟,在這個階段,會根據程式設計師通過程式編碼制定的主觀計劃去初始化類變數和其他資源。

準備階段,變數被賦的是系統要求的零值,在初始化階段,賦的是程式碼裡編寫的值。

初始化階段

好了,基本的類載入過程已經瞭解完了,接下來,我們將學習負責完成載入階段的類載入器。




參考:

【1】:《深入理解Java虛擬機器:JVM高階特性與最佳實踐(第3版)》

相關文章