Java 虛擬機器中的執行時資料區分析

STYeeQan發表於2020-04-26

本文基於 JDK1.8 闡述分析


執行過程

我們都知道 Java 原始檔通過編譯器編譯後,能產生相應的 .Class 檔案,也就是位元組碼檔案。而位元組碼檔案通過 Java 虛擬機器中的直譯器,編譯成特定機器上的機器碼。


跨平臺的特性

在這裡插入圖片描述
Java 能跨平臺的原因是因為:不同的平臺有不同的 JVM 版本,一個 Java 原始檔被編譯成位元組碼檔案,被不同平臺的 JVM 翻譯成特定平臺下的機器碼從而執行。


Java 虛擬機器組成

在這裡插入圖片描述
Java 虛擬機器由三個子系統構成,分別是類載入子系統、JVM 執行時資料區和執行引擎,本文的重點是在 JVM 執行時資料區。

類載入子系統將硬碟上的位元組碼檔案載入進記憶體,JVM 執行記憶體有一套自己的結構劃分如圖所示,最終程式要執行,需要作業系統分配相應的時間排程,由執行引擎去執行,才能得到最終結果。

執行緒共享資料:允許被所有執行緒共享訪問的一塊記憶體區域。

執行緒私有資料:本執行緒私有的一塊記憶體區域


虛擬機器棧(JVM Stacks)

在這裡插入圖片描述

  • Java 虛擬機器棧是執行緒私有的,它的生命週期與執行緒相同,執行緒啟動而產生,執行緒結束而消亡。

  • Java 虛擬機器棧是描述 Java 方法執行的記憶體模型,用於儲存棧幀。

  • 如果執行緒請求的棧深度大於虛擬機器所允許的深度,將丟擲 StackOverflowError 異常。

  • 虛擬機器棧可以動態擴充套件,如果擴充套件時無法申請到足夠的記憶體,就會丟擲 OutOfMemoryError 異常。

  • 除了 native 方法,幾乎所有的 Java 方法都是通虛擬機器棧來實現方法的呼叫和執行(需要程式計數器、堆、方法區的配合)。


  • 棧幀(Stack Frame)
    • 每個方法執行的同時會建立一個棧幀,它是虛擬機器棧的基本元素。
    • 一個方法從呼叫到執行完成的過程,就對應著一個棧幀在虛擬機器棧中入棧到出棧的過程。
    • 在活動執行緒中,只有位於棧頂的棧幀才是有效的,稱為當前棧幀,與這個棧幀相關聯的方法稱為當前方法。執行引擎執行的所有位元組碼指令都只針對當前棧幀進行操作。
    • 棧幀隨著方法呼叫而建立,隨著方法結束而銷燬。
    • 每一個棧幀包含的內容有區域性變數表、運算元棧、動態連結、方法返回地址和一些額外的附加資訊。

  • 區域性變數表(Local Variable Table)
    • 一組變數值儲存空間,用於存放方法引數和方法內定義的區域性變數。
    • 該方法所需要分配的區域性變數表的最大容量在將 Java 編譯為 Class 檔案時已經確定。
    • 一個區域性變數表儲存的是編譯期可知的各種基本資料型別、物件引用和 returnAddress 型別(它指向了一條位元組碼指令的地址)。
    • 區域性變數表的容量以變數槽為最小單位,每個變數槽可以儲存32位長度的記憶體空間。對於64位長度的資料型別(long,double),虛擬機器會以高位對齊方式為其分配兩個連續的變數糙空間。
    • 區域性變數表所需的記憶體空間在編譯期間就能完成分配,在執行期間不會改變其大小。
    • 虛擬機器通過索引定位的方法查詢相應的區域性變數

  • 運算元棧(Operand Stack)
    • 虛擬機器棧中的一個用於計算的臨時資料儲存區。
    • 隨著方法執行和位元組碼指令的執行,會從區域性變數表或物件例項的欄位中複製常量或變數寫入到運算元棧,再隨著計算的進行將棧中元素出棧到區域性變數表或者返回給方法呼叫者,也就是出棧/入棧操作。

  • 動態連結(Dynamic Linking)
    • 在一個class檔案中,一個方法要呼叫其他方法,需要將這些方法的符號引用轉化為其在記憶體地址中的直接引用,而符號引用存在於執行時常量池。
    • 每個棧幀都包含一個指向執行時常量池中該棧所屬方法的符號引用。
    • 這些符號引用一部分會在類載入階段或者第一次使用時就直接轉化為直接引用,這類轉化稱為靜態解析。另一部分將在每次執行期間轉化為直接引用,這類轉化稱為動態連線。

  • 方法返回
    • 一個方法開始執行後,只有兩種退出方式:正常完成出口和異常完成出口
    • 正常完成出口指方法正常完成並退出,根據當前方法返回的位元組碼指令,這時有可能會有返回值傳遞給方法呼叫者(呼叫它的方法),或者無返回值。
    • 異常完成出口指方法執行過程中遇到異常,並且這個異常在方法體內部沒有得到處理,導致方法退出。
    • 無論採用何種退出方式,在方法退出後,都需要返回到方法被呼叫的位置,方法返回時可能需要在棧幀中儲存一些資訊。
    • 一般來說,方法正常退出時,呼叫者的程式計數器的值可以作為返回地址,棧幀中會儲存這個計數器值。而方法異常退出時,返回地址要通過異常處理器表來確定,棧幀中一般不儲存這部分資訊。
  • 附加資訊
    • 虛擬機器規範允許具體的虛擬機器實現增加一些規範中沒有描述的資訊到棧幀之中,例如和除錯相關的資訊,這部分資訊完全取決於不同的虛擬機器實現。
    • 在實際開發中,一般會把動態連線,方法返回地址與其他附加資訊一起歸為一類,稱為棧幀資訊。

程式計數器(Program Counter Register)

程式計數器是一塊較小的記憶體空間,它可以看作是當前執行緒所執行的位元組碼的行號指示器。在虛擬機器的概念模型裡,位元組碼直譯器工作時就是通過改變這個計數器的值來選取下一條需要執行的位元組碼指令。分支、迴圈、跳轉、異常處理、執行緒恢復等基礎功能都需要依賴這個計數器來完成。

  • 程式計數器是執行緒私有的

    JVM 的多執行緒是通過執行緒輪流切換並分配處理器執行時間的方式來實現,在同一時刻一個處理器核心只會執行一條執行緒,處理器切換執行緒時並不會記錄上一個執行緒執行到哪個位置,所以為了執行緒切換後依然能恢復到原位,每條執行緒都需要有各自獨立的程式計數器。

  • JVM 規範中唯一沒有規定 OutOfMemoryError 情況的區域

    程式計數器儲存的是位元組碼檔案的行號,而這個範圍是可知曉的,在一開始分配記憶體時就可以分配一個絕對不會溢位的記憶體。

  • 執行 Native 方法時計數器值為空

    當執行 Java 方法時,程式計數器存放 Java 位元組碼的地址。實現上可能有兩種形式,一種是相對該方法位元組碼開始處的偏移量,叫做 bytecode index(簡稱 bci)。另一種是該 Java 位元組碼指令在記憶體的地址,叫做 bytecode pointer(簡稱 bcp)。

    Native 方法大多通過 C 實現,它的方法體不是由 Java 位元組碼構成,無法應用上述 Java 位元組碼地址的概念,也就不需要儲存位元組碼檔案的行號。

  • Native 方法的實際執行

    Java 執行緒總是需要以某種形式對映到 OS 執行緒上,HotSpot VM 目前在大多數平臺上都使用 1:1 模型(原生執行緒模型),也就是每個 Java 執行緒直接對映到一個 OS 執行緒上執行。此時 native 方法由原生平臺直接執行。


本地方法棧(Native Method Stacks)

本地方法棧為虛擬機器使用到的 Native 方法服務。Native 方法是 Java 通過 JNI 直接呼叫本地 C/C++ 庫,可以認為是 Native 方法相當於 C/C++ 暴露給 Java 的一個介面,Java 通過呼叫這個介面從而呼叫 C/C++ 方法。與虛擬機器棧一樣,本地方法棧區域也會丟擲 StackOverflowError 和 OutOfMemoryError 異常。

  • Java 程式呼叫本地方法

    不同於虛擬機器棧的入/出棧,當執行緒呼叫 native 方法時,虛擬機器只是簡單地動態連線並直接呼叫指定的 native 方法。

  • 本地方法介面回撥 JVM 中的 Java 方法

    如果某個虛擬機器實現的本地方法介面是使用 C 連線模型的話,那個他的本地方法棧就是 C 棧,當一個 C 函式呼叫另一個 C 函式時,它的棧操作是確定的。如果本地方法介面需要回撥JVM 中的 Java 方法,該執行緒會儲存本地方法棧的狀態並進入到另一個Java棧。

  • 不同虛擬機器的不同實現

    虛擬機器規範中對本地方法棧中的方法使用的語言、使用方式與資料結構並沒有強制規定,因此具體的虛擬機器可以自由實現它。常用的 HotSpot 虛擬機器選擇合併了虛擬機器棧和本地方法棧。


堆(Heap)

堆是 JVM 所管理的最大的一塊記憶體空間,主要用於存放各種類的例項物件。堆可以處於物理上不連續的記憶體空間中,只要邏輯上是連續的即可,就像我們的磁碟空間一樣。
在這裡插入圖片描述

  • 分代概念
    • JVM 中堆空間由新生代和老年代兩個區組成
    • 新生代可以劃分為三個區,Eden 區,兩個 Survivor 區
    • Eden = 8/10 的新生代空間大小,from = to = 1/10 的新生代空間大小。
    • JVM 每次只會使用 Eden 和其中的一塊 Survivor 區域來為物件服務,所以無論什麼時候,總是有一塊 Survivor 區域是空閒著的。
  • 常用引數配置
    引數 說明
    -Xms 堆記憶體初始大小
    -Xmx 堆記憶體最大允許大小
    -Xss 每個執行緒的 Stack 大小
    -XX:NewSize(-Xns) 新生代初始大小
    -XX:MaxNewSize(-Xmn) 新生代最大允許大小
    -XX:NewRatio 設定新生代與老年代比值
    -XX:SurvivorRatio 設定 Survivor 與 Eden 比值
    -XX:PermSize 設定持久代初始記憶體大小(JDK8 以前)
    -XX:MaxPermSize 設定持久代最大記憶體(JDK8 以前)
    -XX:MetaspaceSize 設定元空間初始記憶體大小(JDK8 以後)
    -XX:MaxMetaspaceSize 設定元空間最大記憶體(JDK8 以後)
  • 堆 GC

    在堆中分配的記憶體,由 JVM 自動垃圾回收器來管理。關於 GC 詳情,之後再補充。


方法區(Method Area)

方法區是一種規範,不同的虛擬機器的實現也不一樣。從 JDK 1.8 開始,元空間(Metaspace)取代了永久代(PermGen)成為 HotSpot VM 對方法區的實現。方法區儲存載入進來的每一個類的結構資訊,可以看做是將類(Class)的模板資訊,儲存在方法區裡

  • 元空間屬於本地記憶體

    JDK8 以前,永久代是堆的一部分,和新生代、老年代的地址是連續的。JDK8 以後,元空間屬於本地記憶體,不再屬於堆的一部分,它還有一個別名叫非堆(Non-Heap),所以元空間不存在 OOM 記憶體溢位的情況。

  • 方法區是執行緒共享的

    當多個執行緒用到同一個類,而這個類還未被載入,則應該只有一個執行緒去載入類,其他執行緒等待。

相關文章