為什麼Java字串是不可變物件?

codeceo發表於2015-03-18

本文主要來介紹一下Java中的不可變物件,以及Java中String類的不可變性,那麼為什麼Java的String類是不可變物件?讓我們一起來分析一下。

答案一:

最流行的Java面試題之一就是:什麼是不可變物件(immutable object),不可變物件有什麼好處,在什麼情況下應該用,或者更具體一些,Java的String類為什麼要設成immutable型別?

不可變物件,顧名思義就是建立後不可以改變的物件,典型的例子就是Java中的String類。

String s = "ABC";  
s.toLowerCase();

如上s.toLowerCase()並沒有改變“ABC“的值,而是建立了一個新的String類“abc”,然後將新的例項的指向變數s。

相對於可變物件,不可變物件有很多優勢:

1).不可變物件可以提高String Pool的效率和安全性。如果你知道一個物件是不可變的,那麼需要拷貝這個物件的內容時,就不用複製它的本身而只是複製它的地址,複製地址(通常一個指標的大小)需要很小的記憶體效率也很高。對於同時引用這個“ABC”的其他變數也不會造成影響。

2).不可變物件對於多執行緒是安全的,因為在多執行緒同時進行的情況下,一個可變物件的值很可能被其他程式改變,這樣會造成不可預期的結果,而使用不可變物件就可以避免這種情況。
當然也有其他方面原因,但是Java把String設成immutable最大的原因應該是效率和安全。

答案二:

這是一個老生常談的話題(This is an old yet still popular question). 在Java中將String設計成不可變的是綜合考慮到各種因素的結果,想要理解這個問題,需要綜合記憶體,同步,資料結構以及安全等方面的考慮. 在下文中,我將為各種原因做一個小結。

1. 字串常量池的需要

字串常量池(String pool, String intern pool, String保留池) 是Java堆記憶體中一個特殊的儲存區域, 當建立一個String物件時,假如此字串值已經存在於常量池中,則不會建立一個新的物件,而是引用已經存在的物件。
如下面的程式碼所示,將會在堆記憶體中只建立一個實際String物件.

String s1 = "abcd";  
String s2 = "abcd";

示意圖如下所示:

請思考: 假若程式碼如下所示,s1和s2還會指向同一個實際的String物件嗎?假若字串物件允許改變,那麼將會導致各種邏輯錯誤,比如改變一個物件會影響到另一個獨立物件. 嚴格來說,這種常量池的思想,是一種優化手段.

String s1= "ab" + "cd";  
String s2= "abc" + "d";

也許這個問題違反新手的直覺, 但是考慮到現代編譯器會進行常規的優化, 所以他們都會指向常量池中的同一個物件. 或者,你可以用 jd-gui 之類的工具檢視一下編譯後的class檔案.

2. 允許String物件快取HashCode

Java中String物件的雜湊碼被頻繁地使用, 比如在hashMap 等容器中。

字串不變性保證了hash碼的唯一性,因此可以放心地進行快取.這也是一種效能優化手段,意味著不必每次都去計算新的雜湊碼. 在String類的定義中有如下程式碼:

private int hash;//用來快取HashCode

3. 安全性

String被許多的Java類(庫)用來當做引數,例如 網路連線地址URL,檔案路徑path,還有反射機制所需要的String引數等, 假若String不是固定不變的,將會引起各種安全隱患。

假如有如下的程式碼:

boolean connect(string s){
    if (!isSecure(s)) { 
throw new SecurityException(); 
}
    // 如果在其他地方可以修改String,那麼此處就會引起各種預料不到的問題/錯誤 
    causeProblem(s);
}

總體來說, String不可變的原因包括 設計考慮,效率優化問題,以及安全性這三大方面. 事實上,這也是Java面試中的許多 “為什麼” 的答案。

答案三:String類不可變性的好處

String是所有語言中最常用的一個類。我們知道在Java中,String是不可變的、final的。Java在執行時也儲存了一個字串池(String pool),這使得String成為了一個特別的類。

String類不可變性的好處

1.只有當字串是不可變的,字串池才有可能實現。字串池的實現可以在執行時節約很多heap空間,因為不同的字串變數都指向池中的同一個字串。但如果字串是可變的,那麼String interning將不能實現(譯者注:String interning是指對不同的字串僅僅只儲存一個,即不會儲存多個相同的字串。),因為這樣的話,如果變數改變了它的值,那麼其它指向這個值的變數的值也會一起改變。

2.如果字串是可變的,那麼會引起很嚴重的安全問題。譬如,資料庫的使用者名稱、密碼都是以字串的形式傳入來獲得資料庫的連線,或者在socket程式設計中,主機名和埠都是以字串的形式傳入。因為字串是不可變的,所以它的值是不可改變的,否則黑客們可以鑽到空子,改變字串指向的物件的值,造成安全漏洞。

3.因為字串是不可變的,所以是多執行緒安全的,同一個字串例項可以被多個執行緒共享。這樣便不用因為執行緒安全問題而使用同步。字串自己便是執行緒安全的。

4.類載入器要用到字串,不可變性提供了安全性,以便正確的類被載入。譬如你想載入java.sql.Connection類,而這個值被改成了myhacked.Connection,那麼會對你的資料庫造成不可知的破壞。

5.因為字串是不可變的,所以在它建立的時候hashcode就被快取了,不需要重新計算。這就使得字串很適合作為Map中的鍵,字串的處理速度要快過其它的鍵物件。這就是HashMap中的鍵往往都使用字串。

以上就是我總結的Java字串不可變性的好處,希望對你有所幫助。

相關文章