String的intern方法使用場景

程式設計師自由之路發表於2020-09-14

在講intern方法前,我們先簡單回顧下Java中常量池的分類。

常量池的分類

Java中常量池可以分為Class常量池、執行時常量池和字串常量池

1. Class檔案常量池

在Class檔案中除了有類的版本、欄位、方法、介面等描述資訊外,還有一項資訊是常量池(Constant Pool Table),用於存放編譯期生成的各種字面量和符號引用。

所謂字面量類似與我們平常說的常量,主要包括以下兩種

  • 文字字串,例如String a = "aa"。其中"aa"就是字面量。
  • 被final修飾的變數。

符號引用包括以下形式:

  • 類和介面和全限定名:例如對於String這個類,它的全限定名就是java/lang/String。
  • 欄位的名稱和描述符:所謂欄位就是類或者介面中宣告的變數,包括類級別變數和例項級的變數。
  • 方法的名稱和描述符:所謂描述符就相當於方法的引數型別+返回值型別。

2. 執行時常量池

我們知道類載入器會載入對應的Class檔案,上面介紹的Class檔案常量池中的資料,會在類載入後進入方法區中的執行時常量池。執行時常量池是全域性共享的,多個類共用一個執行時常量池。執行時常量池存在於方法區中。

3. 字串常量池

看名字我們就可以知道字串常量池是用來存放字串的,也就是說Class檔案常量池中的文字字串會在類載入時進入字串常量池。

字串常量池執行時常量池是什麼關係呢?上面我們說Class檔案常量池中的字面量會在類載入後進入執行時常量池,其中字面量中也包括文字字串,從這段文字我們可以知道字串常量池存在於執行時常量池中,也就存在於方法區中。

但是到了JDK1.7時,字串常量池被移出了方法區,轉移到了堆裡了。另外需要我們重點注意的是:字串常量池中存放的並不是字串本身,而是字串物件的引用。

程式執行時,除非手動向常量池中新增常量(比如呼叫intern方法),否則jvm不會自動新增常量到常量池。

String 的 intern 方法

String 方法的作用是:判斷字串常量池中是否存在一個引用,這個引用指向的字串物件和當前物件相等(使用 equals 方法判斷相等),如果存在直接返回這個引用,如果不存在則建立一個字串物件並將其引用存入字串常量池。

下面舉個列子幫助加深理解。

//程式碼基於JDK 8

//s1指向字串常量池中的"自由之路"
String s1 = "自由之路";
//s2也指向字串常量池中的"自由之路"
String s2 = "自由之路";
//s3指向堆中的某個物件
String s3 = new String("自由之路");
//因為字串常量池中已經存在"自由之路"的引用,直接返回這個引用
String s4 = s3.intern();

//建立一個字串物件
String s5 = new String("ddd");
//常量池中不存在指向"ddd"的引用,建立一個"ddd"物件,並將其引用存入常量池
String s6 = s5.intern();
//建立一個字串物件
String s7 = new String("ddd");
//常量池中存在指向"ddd"的引用,直接返回
String s8 = s7.intern();

System.out.println("s1==s2:"+(s1==s2));
System.out.println("s1==s3:"+(s1==s3));
System.out.println("s1==s4:"+(s1==s4));

System.out.println("s5==s6:"+(s5==s6));
System.out.println("s6==s8:"+(s6==s8));
System.out.println("s7==s8:"+(s7==s8));

返回的結果如下:

s1==s2:true
s1==s2:false
s1==s2:true
s5==s6:false
s6==s8:true
s7==s8:false

intern 方法使用場景

我們來看下面這個方法。

public class Person{
    String name;
    public void setName(String name)
    {
        this.name = name
    }
}

假如現在的Person物件都叫小明,那麼這些Person物件都會引用一個不同的字串物件。

å¨è¿éæ入å¾çæè¿°

如果我們改進下這個方法:

public class Person{
    String name;
    public void setName(String name)
    {
        this.name = name.intern();
    }
}

那麼物件的引用結構如下圖所示:

img

這樣明顯可以節省多個字串物件的空間。我寫了一個測試程式:

public class JavaTest {

    public static void main(String[] args) throws Exception {
     //一個很大的字串
     String s = "c...c";
     List<Person> personList = new ArrayList<>();

     int count = 100000;
        for (int i = 0; i < count; i++) {
            Person p = new Person();
            p.setName(new String(s));
            //防止垃圾回收
            personList.add(p);
            System.out.println(i);
        }
      System.out.println("success...");
    }

    public static class Person{
        private String name;
        public void setName(String name) {
            this.name = name;
        }
    }

}

為了讓程式快速將記憶體耗盡,我這邊將記憶體設定成5M。

-Xms5m -Xmx5m

結果如下:

...
93889
93890
Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded
	at com.csx.demo.spring.boot.util.JavaTest.main(JavaTest.java:15)

建立9w多個物件時已經報OutOfMemoryError錯誤了。

下面調整下 Person 的 set 方法,再執行下。

public static class Person{
    private String name;
    public void setName(String name) {
        this.name = name.intern();
    }
}
99997
99998
99999
success...

順利執行完成。

相關文章