這一次,終於系統的學習了 JVM 記憶體結構

平頭哥的技術博文發表於2019-11-05

最近在看《 JAVA併發程式設計實踐 》這本書,裡面涉及到了 Java 記憶體模型,通過 Java 記憶體模型順理成章的來到的 JVM 記憶體結構,關於 JVM 記憶體結構的認知還停留在上大學那會的課堂上,一直沒有系統的學習這一塊的知識,所以這一次我把《 深入理解Java虛擬機器JVM高階特性與最佳實踐 》、《 Java虛擬機器規範 Java SE 8版 》這兩本書中關於 JVM 記憶體結構的部分都看了一遍,算是對 JVM 記憶體結構有了新的認識。JVM 記憶體結構是指:Java 虛擬機器定義了若干種程式執行期間會使用的執行時資料區,其中有一些會隨著虛擬機器啟動而建立,隨著虛擬機器退出而銷燬,另一些則與執行緒一一對應,隨著執行緒的開始而建立,隨著執行緒的結束而銷燬。具體的執行時資料區如下圖所示:

JVM 記憶體結構

在 Java 虛擬機器規範中,定義了五種執行時資料區,分別是 Java 堆、方法區、虛擬機器棧、本地方法區、程式計數器,其中 Java 堆和方法區是執行緒共享的。接下來就具體看看這 五種執行時資料區。

Java 堆(Heap)

Java 堆是所有執行緒共享的一塊記憶體區域,它在虛擬機器啟動時 就會被建立,並且單個 JVM 程式有且僅有一個 Java 堆。Java 堆是用來存放物件例項及陣列,也就是說我們程式碼中通過 new 關鍵字 new 出來的物件都存放在這裡。所以這裡也就成為了垃圾回收器的主要活動營地了,於是它就有了一個別名叫做 GC 堆,根據垃圾回收器的規則,我們可以對 Java 堆進行進一步的劃分,具體 Java 堆記憶體結構如下圖所示:

Java 堆記憶體結構

我們可以將 Java 堆劃分為新生代和老年代兩個大模組,在新生代中,我們又可以進一步分為 Eden 空間、From Survivor 空間(s0)、To Survivor 空間(s1),Survivor 空間有一個為空,用於發生 GC 時存放存活物件,老年代存放的是經過多次 Minor GC 仍然存活的物件或者是一些大物件,FGC 就是發生在老年代。

上面就是 Java 堆的具體結構,我們也知道 Java 堆中的各空間大小,我們是可以動態控制的,這個在圖中我也進行了簡單的標註,下面我們一起來詳細的瞭解一下這三個引數:

  • -Xms:JVM啟動時申請的初始Heap值,預設為作業系統實體記憶體的1/64,例如-Xms20m
  • -Xmx:JVM可申請的最大Heap值,預設值為實體記憶體的1/4,例如-Xmx20m,我們最好將 -Xms 和 -Xmx 設為相同值,避免每次垃圾回收完成後JVM重新分配記憶體;
  • -Xmn:設定新生代的記憶體大小,-Xmn 是將NewSize與MaxNewSize設為一致,我們也可以分別設定這兩個引數

在 Java 堆中會發生 OOM 異常,當我們的 Java 堆內有足夠的空間去完成例項分配時,並且堆也無法擴充套件,將會丟擲我們常見的OutOfMemoryError 異常,如下圖所示:

OutOfMemoryError 異常

關於 OOM 異常,我還是想多說一句,網上有一道非常火的面試題:JVM 堆記憶體溢位後,其他執行緒是否可繼續工作?,我個人覺得不少回答是錯誤的,有興趣的可以研究一下。

方法區(Method Area)

方法區(Method Area)與 Java 堆一樣,是各個執行緒共享的記憶體區域,是 Java 虛擬機器中唯二的記憶體共享區域。在 Java 虛擬機器規範中是這樣定義方法區的:它儲存了每個類的結構資訊,例如執行時常量池、欄位、方法資料、建構函式和普通方法的位元組碼內容,還包括一些在類、例項、介面初始化時用到的特殊方法。

方法區在虛擬機器啟動的時候被建立,雖然方法區是堆的邏輯組成部分,但是簡單的虛擬機器實現可以選擇在這個區域不實現垃圾收集與壓縮,方法區在實際記憶體空間中可以不是連續的,對於方法區的容量,你可以是固定的,也可以隨著程式的執行動態擴充套件,並且在不需要過多空間時自動收縮。

上面都是 Java 虛擬機器中的規範,來看看具體的實現,拿我們常用的 HotSpot 虛擬機器來說,在 JDK1.8 之前,方法區也被稱作為永久代,這個方法區會發生我們常見的 java.lang.OutOfMemoryError: PermGen space 異常,我們也可以通過啟動引數來控制方法區的大小:

  • -XX:PermSize 設定最小空間
  • -XX:MaxPermSize 設定最大空間

在 JDK1.8 之後,HotSpot 虛擬機器對方法區進行了不小的改動,徹底移除了永久代,將原來存放在永久代的資料遷移至 Java 堆 或者 Metaspace,方法區被移至到了 Metaspace,字串常量移至 Java Heap,換句話說就是 JDK1.8 開始,Metaspace 也就是我們所謂的方法區,為什麼要做這個改變呢?也許是基於以下兩點原因:

  • 由於 PermGen 記憶體經常會溢位,引發惱人的 java.lang.OutOfMemoryError: PermGen,因此 JVM 的開發者希望這一塊記憶體可以更靈活地被管理,不要再經常出現這樣的 OOM
  • 移除 PermGen 可以促進 HotSpot JVM 與 JRockit VM 的融合,因為 JRockit 沒有永久代。

我們也可以通過設定引數來控制 Metaspace 的空間大小,主要有以下幾個命令:

  • -XX:MetaspaceSize :分配給類後設資料空間(以位元組計)的初始大小。MetaspaceSize的值設定的過大會延長垃圾回收時間。垃圾回收過後,引起下一次垃圾回收的類後設資料空間的大小可能會變大。
  • -XX:MaxMetaspaceSize: 分配給類後設資料空間的最大值,超過此值就會觸發Full GC,此值預設沒有限制,但應取決於系統記憶體的大小。JVM會動態地改變此值。
  • -XX:MinMetaspaceFreeRatio:表示一次GC以後,為了避免增加後設資料空間的大小,空閒的類後設資料的容量的最小比例,不夠就會導致垃圾回收。
  • -XX:MaxMetaspaceFreeRatio:表示一次GC以後,為了避免增加後設資料空間的大小,空閒的類後設資料的容量的最大比例,不夠就會導致垃圾回收。

Java 虛擬機器棧(JVM Stacks)

每一條 Java 虛擬機器執行緒都有自己私有的 Java 虛擬機器棧,這個 Java 虛擬機器棧跟執行緒同時建立,所以它跟執行緒有相同的生命週期。Java 虛擬機器棧描述的是 Java 方法執行的記憶體模型:每一個方法在執行的同時都會建立一個棧幀,用於儲存區域性變數表、運算元棧、動態連結、方法出口等資訊,每一個方法從呼叫直至執行完成的過程,就對應著一個棧幀在 Java 虛擬機器棧中的入棧到出棧的過程

區域性變數表存放了編譯期可知的各種基本資料型別(boolean、byte、char、short、int、float、long、double)、物件引用(reference 型別,它不等同於物件本身,根據不同的虛擬機器實現,它可能是一個指向物件起始地址的引用指標,也可能指向一個代表物件的控制程式碼或者其他與此物件相關的位置)和 returnAddress 型別(指向了一條位元組碼指令的地址)。

其中 64 位長度的 long 和 double 型別的資料會佔用 2 個區域性變數空間(Slot),其餘的資料型別只佔用 1 個。區域性變數表所需的記憶體空間在編譯期間完成分配,當進入一個方法時,這個方法需要在幀中分配多大的區域性變數空間是完全確定的,在方法執行期間不會改變區域性變數表的大小。

Java 虛擬機器棧既允許被實現成固定的大小,也允許根據計算動態來擴充套件和收縮,如果採用固定大小的話,每一個執行緒的 Java 虛擬機器棧容量可以線上程建立的時候獨立選定。在 Java 虛擬機器棧中會發生兩種異常,這個在虛擬機器規範中有指出:

  • 如果執行緒請求分配的棧容量超過 Java 虛擬機器棧允許的最大容量,Java 虛擬機器將會丟擲 StackOverflowError 異常;
  • 如果 Java 虛擬機器棧可以動態擴充套件,並且在嘗試擴充套件的時候無法申請到足夠的記憶體或者在建立新的執行緒時沒有足夠的記憶體去建立對應的 Java 虛擬機器棧,那麼虛擬機器將會丟擲 OutOfMemoryError 異常。

程式計數器(Program Counter Register)

程式計數器也是執行緒私有的,它只需要一塊較小的記憶體空間,你可以把它看作當前執行緒所執行的位元組碼的行號指示器,在虛擬機器的概念模型裡(僅是概念模型,各種虛擬機器可能會通過一些更高效的方式去實現),位元組碼直譯器工作時就是通過改變這個計數器的值來選取下一條需要執行的位元組碼指令,分支、迴圈、跳轉、異常處理、執行緒恢復等基礎功能都需要依賴這個計數器來完成。

我們知道在多執行緒的情況下,並不是一條執行緒一直執行完,而是多個執行緒輪流切換執行,所以為了執行緒切換後能夠恢復到正確的執行位置,我們就需要程式計數器來告訴執行緒接下來該執行哪條指令。如果執行緒正在執行的是一個Java 方法,這個計數器記錄的是正在執行的虛擬機器位元組碼指令的地址,如果正在執行的是 Natvie 方法,這個計數器值則為空(Undefined)。

需要特別注意的是,程式計數器是唯一一個在Java虛擬機器規範中沒有規定任何 OutOfMemoryError 情況的區域

本地方法棧(Native Method Stacks)

本地方法棧(Native Method Stacks)與 Java 虛擬機器棧所發揮的作用是非常相似的,其區別不過是 Java 虛擬機器棧為虛擬機器執行 Java 方法(也就是位元組碼)服務,而本地方法棧則是為虛擬機器使用到的 Native 方法服務。虛擬機器規範中對本地方法棧中的方法使用的語言、使用方式與資料結構並沒有強制規定,因此具體的虛擬機器可以自由實現它。甚至有的虛擬機器(譬如Sun HotSpot虛擬機器)直接就把本地方法棧和虛擬機器棧合二為一。

與 Java 虛擬機器棧一樣,本地方法棧區域也會丟擲 StackOverflowError 和 OutOfMemoryError 異常。

參考

  • 《 深入理解Java虛擬機器JVM高階特性與最佳實踐 》
  • 《 Java虛擬機器規範 Java SE 8版 》

最後

目前網際網路上很多大佬都有 JVM 記憶體結構相關文章,如有雷同,請多多包涵了。原創不易,碼字不易,還希望大家多多支援。若文中有所錯誤之處,還望提出,謝謝,歡迎掃碼關注微信公眾號:「平頭哥的技術博文」,和平頭哥一起學習,一起進步。

平頭哥的技術博文

相關文章