Java垃圾回收調優實戰

ImportNew發表於2015-07-04

Java 垃圾回收調優不同於任何其它效能優化活動。

首先你要確保自己足夠了解整個應用的情況以及調優預期的結果,而不是單單滿足於應用的某一部分調優。一般情況下,遵循以下過程比較容易:

  1. 明確自己的效能目標。
  2. 測試。
  3. 測量調優結果。
  4. 與目標進行比較。
  5. 改變方法並再次測試。

效能調優目標要是可確定且可測量的,這非常重要。這些目標包括延遲、吞吐量和容量,想要了解更多,我推薦看看垃圾回收手冊(Garbage Collection Handbook)中相應的章節。讓我們看看在實踐中如何設定並達到這樣的調優目標。為了這個目的,讓我們來看一個示例程式碼:

//imports skipped for brevity
public class Producer implements Runnable {

  private static ScheduledExecutorService executorService = Executors.newScheduledThreadPool(2);

  private Deque<byte[]> deque;
  private int objectSize;
  private int queueSize;

  public Producer(int objectSize, int ttl) {
    this.deque = new ArrayDeque<byte[]>();
    this.objectSize = objectSize;
    this.queueSize = ttl * 1000;
  }

  @Override
  public void run() {
    for (int i = 0; i < 100; i++) {
      deque.add(new byte[objectSize]);
      if (deque.size() > queueSize) {
        deque.poll();
      }
    }
  }

  public static void main(String[] args) throws InterruptedException {
    executorService.scheduleAtFixedRate(new Producer(200 * 1024 * 1024 / 1000, 5), 0, 100, TimeUnit.MILLISECONDS);
    executorService.scheduleAtFixedRate(new Producer(50 * 1024 * 1024 / 1000, 120), 0, 100, TimeUnit.MILLISECONDS);
    TimeUnit.MINUTES.sleep(10);
    executorService.shutdownNow();
  }
}

程式碼中提交了兩個作業(job),且每 100ms 執行一次。每個作業模擬特定物件的生命週期:先建立物件,讓它們“存活”一段時間,然後忘記它們,讓 GC 回收記憶體。 執行這個示例時,開啟 GC 日誌並使用以下引數:

-XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCTimeStamps

我們立即在日誌檔案中看到 GC 的影響和下面這些相似:

2015-06-04T13:34:16.119-0200: 1.723: [GC (Allocation Failure) [PSYoungGen: 114016K->73191K(234496K)] 421540K->421269K(745984K), 0.0858176 secs] [Times: user=0.04 sys=0.06, real=0.09 secs] 
2015-06-04T13:34:16.738-0200: 2.342: [GC (Allocation Failure) [PSYoungGen: 234462K->93677K(254976K)] 582540K->593275K(766464K), 0.2357086 secs] [Times: user=0.11 sys=0.14, real=0.24 secs] 
2015-06-04T13:34:16.974-0200: 2.578: [Full GC (Ergonomics) [PSYoungGen: 93677K->70109K(254976K)] [ParOldGen: 499597K->511230K(761856K)] 593275K->581339K(1016832K), [Metaspace: 2936K->2936K(1056768K)], 0.0713174 secs] [Times: user=0.21 sys=0.02, real=0.07 secs]

基於日誌中的資訊,我們可以開始改善效能。並請牢記三個不同的目標:

  1. 確保 GC pause(垃圾回收暫停)的最壞情況不要超過預期的臨界值。
  2. 確保應用程式執行緒停滯時間不超過預先確定的閥值。
  3. 降低基礎架構成本,同時確保我們仍可以實現合理的延遲和吞吐量目標。

為此,以三個不同的配置各執行了10分鐘,在下表中總結了三個差距較大的結果:

GC演算法 有效工作 長暫停
-Xmx12g -XX:+UseConcMarkSweepGC 89.8% 560 ms
-Xmx12g -XX:+UseParallelGC 91.5% 1,104 ms
-Xmx8g -XX:+UseConcMarkSweepGC 66.3% 1,610 ms

實驗中,設定不同的 GC 演算法和不同的堆大小,執行相同的程式碼,然後測量垃圾回收暫停的持續時間和吞吐量。實驗細節和結果的解釋都在我們的垃圾回收手冊中。看看手冊中的一些例子,修改一些簡單的配置造成延遲、吞吐量等各方面的效能完全不同。

注意:為了保持示例儘可能簡單,只有數量有限的輸入引數被改變,例如沒有對不同數量的核心(CPU core)或不同堆佈局進行測試。

相關文章