JVM調優總結(九)-新一代的垃圾回收演算法

zhoubangding發表於2017-02-14

轉自:http://pengjiaheng.iteye.com/blog/548472

垃圾回收的瓶頸

    傳統分代垃圾回收方式,已經在一定程度上把垃圾回收給應用帶來的負擔降到了最小,把應用的吞吐量推到了一個極限。但是他無法解決的一個問題,就是Full GC所帶來的應用暫停。在一些對實時性要求很高的應用場景下,GC暫停所帶來的請求堆積和請求失敗是無法接受的。這類應用可能要求請求的返回時間在幾百甚至幾十毫秒以內,如果分代垃圾回收方式要達到這個指標,只能把最大堆的設定限制在一個相對較小範圍內,但是這樣有限制了應用本身的處理能力,同樣也是不可接收的。

    分代垃圾回收方式確實也考慮了實時性要求而提供了併發回收器,支援最大暫停時間的設定,但是受限於分代垃圾回收的記憶體劃分模型,其效果也不是很理想。

    為了達到實時性的要求(其實Java語言最初的設計也是在嵌入式系統上的),一種新垃圾回收方式呼之欲出,它既支援短的暫停時間,又支援大的記憶體空間分配。可以很好的解決傳統分代方式帶來的問題。

 

 

增量收集的演進

    增量收集的方式在理論上可以解決傳統分代方式帶來的問題。增量收集把對堆空間劃分成一系列記憶體塊,使用時,先使用其中一部分(不會全部用完),垃圾收集時把之前用掉的部分中的存活物件再放到後面沒有用的空間中,這樣可以實現一直邊使用邊收集的效果,避免了傳統分代方式整個使用完了再暫停的回收的情況。

    當然,傳統分代收集方式也提供了併發收集,但是他有一個很致命的地方,就是把整個堆做為一個記憶體塊,這樣一方面會造成碎片(無法壓縮),另一方面他的每次收集都是對整個堆的收集,無法進行選擇,在暫停時間的控制上還是很弱。而增量方式,通過記憶體空間的分塊,恰恰可以解決上面問題。

 

 

Garbage First(G1)

這部分的內容主要參考這裡,這篇文章算是對G1演算法論文的解讀。我也沒加什麼東西了。

 

 

目標

從設計目標看G1完全是為了大型應用而準備的。

支援很大的堆

高吞吐量

  --支援多CPU和垃圾回收執行緒

  --在主執行緒暫停的情況下,使用並行收集

  --在主執行緒執行的情況下,使用併發收集

實時目標:可配置在N毫秒內最多隻佔用M毫秒的時間進行垃圾回收

當然G1要達到實時性的要求,相對傳統的分代回收演算法,在效能上會有一些損失。

 

 

演算法詳解

    G1可謂博採眾家之長,力求到達一種完美。他吸取了增量收集優點,把整個堆劃分為一個一個等大小的區域(region)。記憶體的回收和劃分都以region為單位;同時,他也吸取了CMS的特點,把這個垃圾回收過程分為幾個階段,分散一個垃圾回收過程;而且,G1也認同分代垃圾回收的思想,認為不同物件的生命週期不同,可以採取不同收集方式,因此,它也支援分代的垃圾回收。為了達到對回收時間的可預計性,G1在掃描了region以後,對其中的活躍物件的大小進行排序,首先會收集那些活躍物件小的region,以便快速回收空間(要複製的活躍物件少了),因為活躍物件小,裡面可以認為多數都是垃圾,所以這種方式被稱為Garbage First(G1)的垃圾回收演算法,即:垃圾優先的回收。

 

 

回收步驟:

 

初始標記(Initial Marking)

    G1對於每個region都儲存了兩個標識用的bitmap,一個為previous marking bitmap,一個為next marking bitmap,bitmap中包含了一個bit的地址資訊來指向物件的起始點。

    開始Initial Marking之前,首先併發的清空next marking bitmap,然後停止所有應用執行緒,並掃描標識出每個region中root可直接訪問到的物件,將region中top的值放入next top at mark start(TAMS)中,之後恢復所有應用執行緒。

    觸發這個步驟執行的條件為:

    G1定義了一個JVM Heap大小的百分比的閥值,稱為h,另外還有一個H,H的值為(1-h)*Heap Size,目前這個h的值是固定的,後續G1也許會將其改為動態的,根據jvm的執行情況來動態的調整,在分代方式下,G1還定義了一個u以及soft limit,soft limit的值為H-u*Heap Size,當Heap中使用的記憶體超過了soft limit值時,就會在一次clean up執行完畢後在應用允許的GC暫停時間範圍內儘快的執行此步驟;

    在pure方式下,G1將marking與clean up組成一個環,以便clean up能充分的使用marking的資訊,當clean up開始回收時,首先回收能夠帶來最多記憶體空間的regions,當經過多次的clean up,回收到沒多少空間的regions時,G1重新初始化一個新的marking與clean up構成的環。

 

併發標記(Concurrent Marking)

    按照之前Initial Marking掃描到的物件進行遍歷,以識別這些物件的下層物件的活躍狀態,對於在此期間應用執行緒併發修改的物件的以來關係則記錄到remembered set logs中,新建立的物件則放入比top值更高的地址區間中,這些新建立的物件預設狀態即為活躍的,同時修改top值。

 

 

最終標記暫停(Final Marking Pause)

    當應用執行緒的remembered set logs未滿時,是不會放入filled RS buffers中的,在這樣的情況下,這些remebered set logs中記錄的card的修改就會被更新了,因此需要這一步,這一步要做的就是把應用執行緒中存在的remembered set logs的內容進行處理,並相應的修改remembered sets,這一步需要暫停應用,並行的執行。

 

 

存活物件計算及清除(Live Data Counting and Cleanup)

    值得注意的是,在G1中,並不是說Final Marking Pause執行完了,就肯定執行Cleanup這步的,由於這步需要暫停應用,G1為了能夠達到準實時的要求,需要根據使用者指定的最大的GC造成的暫停時間來合理的規劃什麼時候執行Cleanup,另外還有幾種情況也是會觸發這個步驟的執行的:

    G1採用的是複製方法來進行收集,必須保證每次的”to space”的空間都是夠的,因此G1採取的策略是當已經使用的記憶體空間達到了H時,就執行Cleanup這個步驟;

    對於full-young和partially-young的分代模式的G1而言,則還有情況會觸發Cleanup的執行,full-young模式下,G1根據應用可接受的暫停時間、回收young regions需要消耗的時間來估算出一個yound regions的數量值,當JVM中分配物件的young regions的數量達到此值時,Cleanup就會執行;partially-young模式下,則會盡量頻繁的在應用可接受的暫停時間範圍內執行Cleanup,並最大限度的去執行non-young regions的Cleanup。

 

 

展望

    以後JVM的調優或許跟多需要針對G1演算法進行調優了。

相關文章