JVM記憶體管理、JVM垃圾回收機制、新生代、老年代以及永久代

zhb123GGGGGG發表於2014-11-07


     如果大家想深入的瞭解JVM,可以讀讀周志明《深入理解Java虛擬機器:JVM高階特性與最佳實踐》

     需要掌握的東西,包括以下內容、判斷物件存活還是死亡的演算法(引用計數演算法、可達性分析演算法)、常見的垃圾收集演算法(複製演算法、分代收集演算法等以及這些演算法適用於什麼代)以及常見的垃圾收集器的特點(這些收集器適用於什麼年代的記憶體收集)。

     

     JVM執行時資料區由程式計數器、堆、虛擬機器棧、本地方法棧、方法區部分組成,結構圖如下所示。

     JVM記憶體結構由程式計數器、堆、棧、本地方法棧、方法區等部分組成,結構圖如下所示:

                 


   1)程式計數器

   幾乎不佔有記憶體。用於取下一條執行的指令。

   2)堆

   所有通過new建立的物件的記憶體都在堆中分配,其大小可以通過-Xmx和-Xms來控制。堆被劃分為新生代和舊生

代,新生代又被進一步劃分為Eden和Survivor區,最後Survivor由FromSpace和ToSpace組成,結構圖如下所示:

    新生代。新建的物件都是用新生代分配記憶體,Eden空間不足的時候,會把存活的物件轉移到Survivor中,新生代

大小可以由-Xmn來控制,也可以用-XX:SurvivorRatio來控制Eden和Survivor的比例舊生代。用於存放新生代中經過

多次垃圾回收仍然存活的物件。

                 

   3)棧

   每個執行緒執行每個方法的時候都會在棧中申請一個棧幀,每個棧幀包括區域性變數區和運算元棧,用於存放此次方

法呼叫過程中的臨時變數、引數和中間結果。

   4)本地方法棧

   用於支援native方法的執行,儲存了每個native方法呼叫的狀態

   5)方法區

   存放了要載入的類資訊、靜態變數、final型別的常量、屬性和方法資訊。JVM用永久代(PermanetGeneration)

來存放方法區,(在JDK的HotSpot虛擬機器中,可以認為方法區就是永久代,但是在其他型別的虛擬機器中,沒有永久代

的概念,有關資訊可以看周志明的書)可通過-XX:PermSize和-XX:MaxPermSize來指定最小值和最大值。


   JVM垃圾回收機制

   JVM分別對新生代和舊生代採用不同的垃圾回收機制

新生代的GC:

新生代通常存活時間較短,因此基於複製演算法來進行回收,所謂複製演算法就是掃描出存活的物件,並複製到一塊新的完全未使用的空間中,對應於新生代,就是在Eden和其中一個Survivor,複製到另一個之間Survivor空間中,然後清理掉原來就是在Eden和其中一個Survivor中的物件。新生代採用空閒指標的方式來控制GC觸發,指標保持最後一個分配的物件在新生代區間的位置,當有新的物件要分配記憶體時,用於檢查空間是否足夠,不夠就觸發GC。當連續分配物件時,物件會逐漸從eden到 survivor,最後到老年代。

用javavisualVM來檢視,能明顯觀察到新生代滿了後,會把物件轉移到舊生代,然後清空繼續裝載,當舊生代也滿了後,就會報outofmemory的異常,如下圖所示:

JVM記憶體管理和JVM垃圾回收機制 - Gui Xun Long - Hello Java

 
     在執行機制上JVM提供了序列GC(SerialGC)、並行回收GC(ParallelScavenge)和並行GC(ParNew)

1)序列GC

在整個掃描和複製過程採用單執行緒的方式來進行,適用於單CPU、新生代空間較小及對暫停時間要求不是非常高的應用上,是client級別預設的GC方式,可以通過-XX:+UseSerialGC來強制指定

2)並行回收GC

在整個掃描和複製過程採用多執行緒的方式來進行,適用於多CPU、對暫停時間要求較短的應用上,是server級別預設採用的GC方式,可用-XX:+UseParallelGC來強制指定,用-XX:ParallelGCThreads=4來指定執行緒數

3)並行GC

與舊生代的併發GC配合使用

舊生代的GC:

舊生代與新生代不同,物件存活的時間比較長,比較穩定,因此採用標記(Mark)演算法來進行回收,所謂標記就是掃描出存活的物件,然後再進行回收未被標記的物件,回收後對用空出的空間要麼進行合併,要麼標記出來便於下次進行分配,總之就是要減少記憶體碎片帶來的效率損耗。在執行機制上JVM提供了序列 GC(SerialMSC)、並行GC(parallelMSC)和併發GC(CMS),具體演算法細節還有待進一步深入研究。

以上各種GC機制是需要組合使用的,指定方式由下表所示:

JVM記憶體管理和JVM垃圾回收機制 - Gui Xun Long - Hello Java

 

Java GC、新生代、老年代

   Java 中的堆是 JVM 所管理的最大的一塊記憶體空間,主要用於存放各種類的例項物件。

   在 Java 中,堆被劃分成兩個不同的區域:新生代 ( Young )、老年代 ( Old )。新生代 ( Young ) 又被劃分為

三個區域:Eden、From Survivor、To Survivor。

   這樣劃分的目的是為了使 JVM 能夠更好的管理堆記憶體中的物件,包括記憶體的分配以及回收。

   堆的記憶體模型大致為:

     

    從圖中可以看出: 堆大小 = 新生代 + 老年代。其中,堆的大小可以通過引數 –Xms、-Xmx 來指定。


   (本人使用的是 JDK1.6,以下涉及的 JVM 預設值均以該版本為準。)
   預設的,新生代 ( Young ) 與老年代 ( Old ) 的比例的值為 1:2 ( 該值可以通過引數 –XX:NewRatio 來指定

 ),即:新生代 ( Young ) = 1/3 的堆空間大小。老年代 ( Old ) = 2/3 的堆空間大小。其中,新生代 ( Young )

 被細分為 Eden 和 兩個 Survivor 區域,這兩個 Survivor 區域分別被命名為 from 和 to,以示區分。


    預設的,Edem : from : to = 8 :1 : 1 ( 可以通過引數–XX:SurvivorRatio 來設定 ),即: Eden = 8/10 的

新生代空間大小,from = to = 1/10 的新生代空間大小。


    JVM 每次只會使用 Eden 和其中的一塊 Survivor 區域來為物件服務,所以無論什麼時候,總是有一塊Survivor

 區域是空閒著的。

    因此,新生代實際可用的記憶體空間為 9/10 ( 即90% )的新生代空間。

GC 堆                                                                                  

    Java 中的堆也是 GC 收集垃圾的主要區域。GC 分為兩種:Minor GC、FullGC ( 或稱為 Major GC )。

    Minor GC 是發生在新生代中的垃圾收集動作,所採用的是複製演算法

    新生代幾乎是所有 Java 物件出生的地方,即 Java 物件申請的記憶體以及存放都是在這個地方。Java 中的大部

分物件通常不需長久存活,具有朝生夕滅的性質。

    當一個物件被判定為 "死亡" 的時候,GC 就有責任來回收掉這部分物件的記憶體空間。新生代是 GC 收集垃圾的

頻繁區域。

   當物件在 Eden ( 包括一個 Survivor 區域,這裡假設是 from 區域 ) 出生後,在經過一次 Minor GC 後,如

果物件還存活,並且能夠被另外一塊 Survivor 區域所容納( 上面已經假設為 from 區域,這裡應為 to 區域,

即 to 區域有足夠的記憶體空間來儲存 Eden 和 from 區域中存活的物件 ),則使用複製演算法將這些仍然還存活的對

象複製到另外一塊 Survivor 區域 ( 即 to 區域 ) 中,然後清理所使用過的 Eden 以及 Survivor 區域 ( 即

from 區域 ),並且將這些物件的年齡設定為1,以後物件在 Survivor 區每熬過一次 Minor GC,就將物件的年

齡 + 1,當物件的年齡達到某個值時 ( 預設是 15 歲,可以通過引數 -XX:MaxTenuringThreshold 來設定

 ),這些物件就會成為老年代。

   但這也不是一定的,對於一些較大的物件 ( 即需要分配一塊較大的連續記憶體空間 ) 則是直接進入到老年代


   Full GC 發生在老年代的垃圾收集動作,所採用的是標記-清除演算法

   現實的生活中,老年代的人通常會比新生代的人"早死"。堆記憶體中的老年代(Old)不同於這個,老年代裡面的物件

幾乎個個都是在 Survivor 區域中熬過來的,它們是不會那麼容易就 "死掉" 了的。因此,Full GC 發生的次數不

會有 Minor GC 那麼頻繁,並且做一次 Full GC 要比進行一次 Minor GC 的時間更長。


   另外,標記-清除演算法收集垃圾的時候會產生許多的記憶體碎片 ( 即不連續的記憶體空間 ),此後需要為較大的物件

分配記憶體空間時,若無法找到足夠的連續的記憶體空間,就會提前觸發一次 GC 的收集動作。


GC 日誌                                                                               

    publicstaticvoid main(String[] args) {    Object obj = new Object();   System.gc();   System.out.println();    obj = new Object();   obj = new Object();    System.gc();    System.out.println();}

   設定 JVM 引數為 -XX:+PrintGCDetails,使得控制檯能夠顯示 GC 相關的日誌資訊,執行上面程式碼,下面是其中

一次執行的結果。

   Full GC 資訊與 Minor GC 的資訊是相似的,這裡就不一個一個的畫出來了。

   從 Full GC 資訊可知,新生代可用的記憶體大小約為 18M,則新生代實際分配得到的記憶體空間約為 20M(為什麼是

 20M? 請繼續看下面...)。老年代分得的記憶體大小約為 42M,堆的可用記憶體的大小約為 60M。可以計算出: 18432K

 ( 新生代可用空間 ) + 42112K ( 老年代空間 ) = 60544K ( 堆的可用空間 )


    新生代約佔堆大小的 1/3,老年代約佔堆大小的 2/3。也可以看出,GC 對新生代的回收比較樂觀,而對老年代

以及方法區的回收並不明顯或者說不及新生代。

    並且在這裡 Full GC 耗時是 Minor GC 的 22.89 倍。

JVM 引數選項                                                                        


    jvm 可配置的引數選項可以參考 Oracle 官方網站給出的相關資訊:          http://www.oracle.com/technetwork/java/javase/tech/vmoptions-jsp-140102.html


    下面只列舉其中的幾個常用和容易掌握的配置選項

-Xms

初始堆大小。如:-Xms256m

-Xmx

最大堆大小。如:-Xmx512m

-Xmn

新生代大小。通常為 Xmx 的 1/3 或 1/4。新生代 = Eden + 2 個 Survivor 空間。實際可用空間為 = Eden + 1 個 Survivor,即 90% 

-Xss

JDK1.5+ 每個執行緒堆疊大小為 1M,一般來說如果棧不是很深的話, 1M 是絕對夠用了的。

-XX:NewRatio

新生代與老年代的比例,如 –XX:NewRatio=2,則新生代佔整個堆空間的1/3,老年代佔2/3

-XX:SurvivorRatio

新生代中 Eden 與 Survivor 的比值。預設值為 8。即 Eden 佔新生代空間的 8/10,另外兩個 Survivor 各佔 1/10 

-XX:PermSize

永久代(方法區)的初始大小

-XX:MaxPermSize

永久代(方法區)的最大值

-XX:+PrintGCDetails

列印 GC 資訊

-XX:+HeapDumpOnOutOfMemoryError

讓虛擬機器在發生記憶體溢位時 Dump 出當前的記憶體堆轉儲快照,以便分析用


  1 /** 2  -Xms60m 3  -Xmx60m 4 -Xmn20m 5  -XX:NewRatio=2 ( 若 Xms = Xmx, 並且設定了 Xmn, 那麼該項配置就不需要配置了 ) 6  -XX:SurvivorRatio=8 7  -XX:PermSize=30m 8  -XX:MaxPermSize=30m 9  -XX:+PrintGCDetails10  */11 publicstaticvoid main(String[] args) {12    new Test().doTest();13 }14 15 publicvoid doTest(){16     Integer M = newInteger(1024 * 1024 * 1);  //單位, 兆(M)17     byte[] bytes = newbyte[1 * M]; //申請1M 大小的記憶體空間18     bytes = null //斷開引用鏈19    System.gc();   //通知 GC 收集垃圾20    System.out.println();21     bytes = newbyte[1 * M];  //重新申請1M 大小的記憶體空間22     bytes = newbyte[1 * M];  //再次申請1M 大小的記憶體空間23    System.gc();24    System.out.println();25 }

     按上面程式碼中註釋的資訊設定 jvm 相關的引數項,並執行程式,下面是一次執行完成控制檯列印的結果:

[ GC [ PSYoungGen:  1351K -> 288K (18432K) ]  1351K -> 288K (59392K), 0.0012389 secs]  [ Times: user=0.00 sys=0.00, real=0.00 secs ] [ Full GC (System)  [ PSYoungGen: 288K -> 0K (18432K)]  [ PSOldGen:  0K -> 160K (40960K) ]  288K -> 160K (59392K)  [ PSPermGen: 2942K -> 2942K (30720K) ], 0.0057649 secs ] [ Times: user=0.00  sys=0.00,  real=0.01 secs ] [ GC [ PSYoungGen:  2703K -> 1056K (18432K) ] 2863K -> 1216K(59392K), 0.0008206 secs ]  [ Times:user=0.00 sys=0.00, real=0.00 secs] [ Full GC (System)  [ PSYoungGen:  1056K -> 0K (18432K) ] [ PSOldGen:  160K -> 1184K(40960K) ]  1216K -> 1184K(59392K)  [ PSPermGen:  2951K -> 2951K (30720K) ], 0.0052445 secs]  [ Times: user=0.02 sys=0.00, real=0.01 secs ] Heap PSYoungGen      total 18432K, used 327K [0x00000000fec00000, 0x0000000100000000,0x0000000100000000)  eden space 16384K, 2% used[0x00000000fec00000,0x00000000fec51f58,0x00000000ffc00000)  fromspace 2048K, 0% used[0x00000000ffe00000,0x00000000ffe00000,0x0000000100000000) to   space 2048K, 0% used[0x00000000ffc00000,0x00000000ffc00000,0x00000000ffe00000) PSOldGen        total 40960K, used 1184K [0x00000000fc400000, 0x00000000fec00000,0x00000000fec00000)  object space 40960K, 2% used[0x00000000fc400000,0x00000000fc5281f8,0x00000000fec00000) PSPermGen       total 30720K, used 2959K [0x00000000fa600000, 0x00000000fc400000,0x00000000fc400000)  object space 30720K, 9% used [0x00000000fa600000,0x00000000fa8e3ce0,0x00000000fc400000)

  從列印結果可以看出,堆中新生代的記憶體空間為18432K ( 約 18M ),eden 的記憶體空間為 16384K ( 約 16M),

from/ to survivor 的記憶體空間為 2048K ( 約2M)。


    這裡所配置的 Xmn 為 20M,也就是指定了新生代的記憶體空間為 20M,可是從列印的堆資訊來看,新生代怎麼就

只有 18M 呢? 另外的 2M 哪裡去了? 別急,是這樣的。新生代 = eden + from + to = 16 + 2 + 2 = 20M,可見新

生代的記憶體空間確實是按 Xmn 引數分配得到的。而且這裡指定了 SurvivorRatio = 8,因此,eden = 8/10 的新生

代空間 = 8/10 * 20 = 16M。from = to = 1/10 的新生代空間 = 1/10 * 20 = 2M。


    堆資訊中新生代的 total 18432K 是這樣來的:eden + 1 個 survivor = 16384K + 2048K = 18432K,即約為 18M。

   因為 jvm 每次只是用新生代中的 eden 和 一個 survivor,因此新生代實際的可用記憶體空間大小為所指定的

 90%。

   因此可以知道,這裡新生代的記憶體空間指的是新生代可用的總的記憶體空間,而不是指整個新生代的空間大小。

   另外,可以看出老年代的記憶體空間為 40960K ( 約 40M),堆大小 = 新生代 + 老年代。因此在這裡,老年代 =

 堆大小 - 新生代 = 60 -20 = 40M。

   最後,這裡還指定了 PermSize = 30m,PermGen即永久代 ( 方法區 ),它還有一個名字,叫非堆,主要用來儲存

由 jvm 載入的類檔案資訊、常量、靜態變數等。

   回到 doTest() 方法中,可以看到程式碼在第 17、21、22 這三行中分別申請了一塊 1M大小的記憶體空間,並在 19

 和 23 這兩行中分別顯式的呼叫了 System.gc()。從控制檯列印的資訊來看,每次調 System.gc(),是先進行

 Minor GC,然後再進行 Full GC。


第 19 行觸發的 Minor GC 收集分析:


   從資訊 PSYoungGen : 1351K -> 288K,可以知道,在第 17 行為bytes 分配的記憶體空間已經被回收完成。

引起 GC 回收這 1M 記憶體空間的因素是第 18 行的 bytes = null;   bytes 為 null 表明之前申請的那 1M 大小的

記憶體空間現在已經沒有任何引用變數在使用它了,並且在記憶體中它處於一種不可到達狀態 ( 即沒有任何引用鏈與 GC

 Roots 相連 )。那麼,當 Minor GC 發生的時候,GC 就會來回收掉這部分的記憶體空間。


行觸發的 Full GC 收集分析:

   在 Minor GC 的時候,資訊顯示 PSYoungGen :  1351K -> 288K,再看看Full GC 中顯示的 PSYoungGen :  288K

 -> 0K,可以看出,Full GC 後,新生代的記憶體使用變成0K 了,那麼這 288K 到底哪去了 ? 難道都被GC 當成垃圾

回收掉了 ? 當然不是了。我還特意在 main 方法中 new 了一個 Test 類的例項,這裡的 Test 類的例項屬於小對

象,它應該被分配到新生代記憶體當中,現在還在呼叫這個例項的doTest 方法呢,GC 不可能在這個時候來回收它的。


   接著往下看 Full GC 的資訊,會發現一個很有趣的現象,PSOldGen: 0K  -> 160K,可以看到,Full GC 後,老

年代的記憶體使用從 0K 變成了 160K,想必你已經猜到大概是怎麼回事了。當 Full GC 進行的時候,預設的方式是盡

量清空新生代 ( YoungGen ),因此在調 System.gc() 時,新生代 ( YoungGen ) 中存活的物件會提前進入老年代。


第  行觸發的 Minor GC 收集分析:

    從資訊 PSYoungGen : 2703K -> 1056K,可以知道,在第 21 行建立的,大小為 1M 的陣列被 GC 回收了。在第

22 行建立的,大小也為 1M 的陣列由於 bytes 引用變數還在引用它,因此,它暫時未被 GC 回收。 


第23行觸發的 Full GC 收集分析:

   在 Minor GC 的時候,資訊顯示 PSYoungGen :  2703K -> 1056K,FullGC 中顯示的 PSYoungGen :  1056K ->

 0K,以及 PSOldGen:  160K -> 1184K,可以知道,新生代 (YoungGen ) 中存活的物件又提前進入老年代了。

相關文章