淺析JVM記憶體結構和6大區域

zhaozheng7758的專欄發表於2015-03-20

其實對於我們一般理解的計算機記憶體,它算是CPU與計算機打交道最頻繁的區域,所有資料都是先經過硬碟至記憶體,然後由CPU再從記憶體中獲取資料進行處理,又將資料儲存到記憶體,通過分頁或分片技術將記憶體中的資料再flush至硬碟。那JVM的記憶體結構到底是如何呢?JVM做為一個執行在作業系統上,但又獨立於os執行的平臺,它的記憶體至少應該包括象暫存器、堆疊等區域。

JVM在執行時將資料劃分為了6個區域來儲存,而不僅僅是大家熟知的Heap區域,這6個區域圖示如下:

JVM記憶體的分配結構示意圖

下面將逐一介紹下各個區域所做的工作及其充當的功能。

PC Register(PC暫存器)

PC暫存器是一塊很小的記憶體區域,主要作用是記錄當前執行緒所執行的位元組碼的行號。位元組碼直譯器工作時就是通過改變當前執行緒的程式計數器選取下一條位元組碼指令來工作的。任何分支,迴圈,方法呼叫,判斷,異常處理,執行緒等待以及恢復執行緒,遞迴等等都是通過這個計數器來完成的。

由於java多執行緒是通過交替執行緒輪流切換並分配處理器時間的方式來實現的,在任何一個確定的時間裡,在處理器的一個核心只會執行一條執行緒中的指令。因此為了執行緒等待結束需要恢復到正確的位置執行,每條執行緒都會有一個獨立的程式計數器來記錄當前指令的行號。計數器之間相互獨立互不影響,我們稱這塊記憶體為“執行緒私有”的記憶體。

如果所呼叫的方法為native的,則PC暫存器中不儲存任何資訊。

JVM棧

JVM棧是執行緒私有的,每個執行緒建立的同時都會建立JVM棧,JVM棧中存放的為當前執行緒中區域性基本型別的變數(java中定義的八種基本型別:boolean、char、byte、short、int、long、float、double)、部分的返回結果以及Stack Frame,非基本型別的物件在JVM棧上僅存放一個指向堆上的地址,因此Java中基本型別的變數是值傳遞,而非基本型別的變數是引用傳遞,Sun           JDK的實現中JVM棧的空間是在實體記憶體上分配的,而不是從堆上分配。

由於JVM棧是執行緒私有的,因此其在記憶體分配上非常高效,並且當執行緒執行完畢後,這些記憶體也就被自動回收。

當JVM棧的空間不足時,會丟擲StackOverflowError的錯誤,在Sun JDK中可以通過-Xss來指定棧的大小,例如如下程式碼:

new Thread(new Runnable(){ 
           public void run() { 
              loop(0); 
           }        
           private void loop (int i){ 
              if(i!=1000){ 
                  i++; 
loop (i); 
              } 
              else{ 
                  return; 
              } 
           } 
          }).start();

當JVM引數設定為-Xss1K,執行後會報出類似下面的錯誤:

Exception in thread “Thread-0″java.lang.StackOverflowError

堆(Heap)

Heap是大家最為熟悉的區域,它是JVM用來儲存物件例項以及陣列值的區域,可以認為Java中所有通過new建立的物件的記憶體都在此分配,Heap中的物件的記憶體需要等待GC進行回收,Heap在32位的作業系統上最大為2G,在64位的作業系統上則沒有限制,其大小通過-Xms和-Xmx來控制,-Xms為JVM啟動時申請的最小Heap記憶體,預設為實體記憶體的1/64但小於1G,-Xmx為JVM可申請的最大Heap記憶體,預設為實體記憶體的1/4,預設當空餘堆記憶體小於40%時,JVM會增大Heap的大小到-Xmx指定的大小,可通過-XX:MinHeapFreeRatio=來指定這個比例,當空餘堆記憶體大於70%時,JVM會將Heap的大小往-Xms指定的大小調整,可通過-XX:MaxHeapFreeRatio=來指定這個比例,但對於執行系統而言,為了避免頻繁的Heap Size的大小,通常都會將-Xms和-Xmx的值設成一樣,因此這兩個用於調整比例的引數通常是沒用的。其實jvm中對於堆記憶體的分配、使用、管理、收集等有更為精巧的設計,具體可以在JVM堆記憶體分析中進行詳細介紹。

當堆中需要使用的記憶體超過其允許的大小時,會丟擲OutOfMemory的錯誤資訊。

方法區域(MethodArea)

方法區域存放了所載入的類的資訊(名稱、修飾符等)、類中的靜態變數、類中定義為final型別的常量、類中的Field資訊、類中的方法資訊,當開發人員在程式中通過Class物件中的getName、isInterface等方法來獲取資訊時,這些資料都來源於方法區域,可見方法區域的重要性。同樣,方法區域也是全域性共享的,它在虛擬機器啟動時在一定的條件下它也會被GC,當方法區域需要使用的記憶體超過其允許的大小時,會丟擲OutOfMemory的錯誤資訊。

在Sun JDK中這塊區域對應的為PermanetGeneration,又稱為持久代,預設為64M,可通過-XX:PermSize以及-XX:MaxPermSize來指定其大小。

執行時常量池(RuntimeConstant Pool)

類似C中的符號表,存放的為類中的固定的常量資訊、方法和Field的引用資訊等,其空間從方法區域中分配。類或介面的常量池在該類的class檔案被java虛擬機器成功裝載時分配。

本地方法堆疊(NativeMethod Stacks)

JVM採用本地方法堆疊來支援native方法的執行,此區域用於儲存每個native方法呼叫的狀態。

例如有這麼一段程式碼:

public class A { 
                   public static void main(String[]args){ 
           String a="a"; 
          String b="b"; 
           String ab="ab"; 
           System.out.println((a+b)==ab);       // false 
           System.out.println(("a"+"b")==ab);   // true 
           final String afinal="a"; 
           String result=afinal+"b"; 
           System.out.println(result==ab);      // true 
           String plus=a+"b"; 
           System.out.println(plus==ab);        // false 
             System.out.println(plus.intern()==ab);  // true 
    } 
}

分析下上面程式碼執行的結果,可通過javap –verbose A來輔助理解分析。

 (a+b)==ab

a+b是兩個變數相加,需要到執行時才能確定其值,到執行時後JVM會為兩者相加後產生一個新的物件,因此a+b==ab的結果為false。

(“a”+”b”)==ab

“a”+”b”是常量,在編譯時JVM已經將其變為”ab”字串了,而ab=”ab”也是常量,這兩者在常量池即為同一地址,因此(“a”+”b”)==ab為true。

result==ab

result=afinal+”b”,afinal是個final的變數, result在編譯時也已經被轉變為了”ab”,和”ab”在常量池中同樣為同一地址,因此result==ab為true。

plus=ab

plus和a+b的情況是相同的,因此plus==ab為false。

plus.intern()==ab

這裡的不同點在於呼叫了plus.intern()方法,這個方法的作用是獲取plus指向的常量池地址,因此plus.intern()==ab為true。

在掌握了JVM物件記憶體分配的機制後,接下來看看JVM是如何做到自動的物件記憶體回收的,這裡指的的是Heap以及Method Area的回收,其他幾個區域的回收都由JVM簡單的按生命週期來進行管理。

相關文章