深入理解 Java String#intern() 記憶體模型

Code Log發表於2015-03-24

大家知道,Java中string.intern()方法呼叫會先去字串常量池中查詢相應的字串,如果字串不存在,就會在字串常量池中建立該字串然後再返回。

字串常量池是一個固定大小的HashMap,桶的數量預設是1009, 從Java7u40開始,該預設值增大到60013。在Java6當中,字串常量池是放在Perm空間的,從Java7開始,字串常量池被移到Heap空間。下面,我們通過測試程式來窺探字串常量池在Java6,Java7兩個不同版本底下的記憶體分配情況。

測試程式

public class StringPoolTest {

    public void testStringPoolWithLongString(){
        long i=0;
        while(true){
            String longString = "This is a very long string, very very long string to test the gc behavior of the string constant pool"+i;
            longString.intern();
            i++;
        }
    }

    public static void main(String[] args){
        StringPoolTest stringPoolTest = new StringPoolTest();
        stringPoolTest.testStringPoolWithLongString();
    }
}

測試程式很簡單,一個死迴圈,迴圈裡面通過遞增變數i製造唯一的字串,然後用main函式啟動程式。

Java 6

我們使用版本Jdk1.6.0_29來跑該程式,開啟Java VisualVM監控,可以看到,Perm區不斷髮生GC,由此的出結論,雖然字串常量池放在Perm空間,但當Perm空間接近滿的時候,JVM會將字串常量池中的無用字串回收掉。

Java 7

下面,我們切換到Jdk1.7.0_67重跑該程式,可以看到Perm區記憶體分配曲線很平滑,沒有出現記憶體分配的現象。

但在Heap空間,新的物件不斷產生,然後不斷觸發GC

結論

由於Perm區大小是有限的,通常只有幾十MB,所以不推薦在Java6下廣泛使用String.intern(),這篇文章string-intern-in-java-6-7-8的效能測試表明,在Java6底下大量使用intern()會導致應用效能的顯著下降,還有可能產生OOM錯誤。但從Java7開始,字串常量池被移到了Heap空間,Heap空間的大小隻受制於機器的真實記憶體大小,因此,在Java7下使用String.intern()能更有效地減少重複String物件對記憶體的佔用。

相關文章