Java堆、棧和常量池以及相關String的詳細講解（經典中的經典）

一：在JAVA中，有六個不同的地方可以儲存資料：

1. 暫存器（register）。這是最快的儲存區，因為它位於不同於其他儲存區的地方——處理器內部。但是暫存器的數量極其有限，所以暫存器由編譯器根據需求進行分配。你不能直接控制，也不能在程式中感覺到暫存器存在的任何跡象。

------最快的儲存區, 由編譯器根據需求進行分配,我們在程式中無法控制.

2. 堆疊（stack）。位於通用RAM中，但通過它的“堆疊指標”可以從處理器哪裡獲得支援。堆疊指標若向下移動，則分配新的記憶體；若向上移動，則釋放那些記憶體。這是一種快速有效的分配儲存方法，僅次於暫存器。建立程式時候，JAVA編譯器必須知道儲存在堆疊內所有資料的確切大小和生命週期，因為它必須生成相應的程式碼，以便上下移動堆疊指標。這一約束限制了程式的靈活性，所以雖然某些JAVA資料儲存在堆疊中——特別是物件引用，但是JAVA物件不儲存其中。

------存放基本型別的變數資料和物件，陣列的引用，但物件本身不存放在棧中，而是存放在堆（new 出來的物件）或者常量池中（字串常量物件存放在常量池中）

3. 堆（heap）。一種通用性的記憶體池（也存在於RAM中），用於存放所以的JAVA物件。堆不同於堆疊的好處是：編譯器不需要知道要從堆裡分配多少儲存區域，也不必知道儲存的資料在堆裡存活多長時間。因此，在堆裡分配儲存有很大的靈活性。當你需要建立一個物件的時候，只需要new寫一行簡單的程式碼，當執行這行程式碼時，會自動在堆裡進行儲存分配。當然，為這種靈活性必須要付出相應的程式碼。用堆進行儲存分配比用堆疊進行儲存儲存需要更多的時間。

------存放所有new出來的物件。

4. 靜態儲存（static storage）。這裡的“靜態”是指“在固定的位置”。靜態儲存裡存放程式執行時一直存在的資料。你可用關鍵字static來標識一個物件的特定元素是靜態的，但JAVA物件本身從來不會存放在靜態儲存空間裡。

------存放靜態成員（static定義的）

5. 常量儲存（constant storage）。常量值通常直接存放在程式程式碼內部，這樣做是安全的，因為它們永遠不會被改變。有時，在嵌入式系統中，常量本身會和其他部分分割離開，所以在這種情況下，可以選擇將其放在ROM中

------存放字串常量和基本型別常量（public static final）

6. 非RAM儲存。如果資料完全存活於程式之外，那麼它可以不受程式的任何控制，在程式沒有執行時也可以存在。

------硬碟等永久儲存空間就速度來說，有如下關係：

暫存器 >堆疊 > 堆 > 其它

這裡我們主要關心棧，堆和常量池，對於棧和常量池中的物件可以共享，對於堆中的物件不可以共享。

棧中的資料大小和生命週期是可以確定的，當沒有引用指向資料時，這個資料就會消失。堆中的物件的由垃圾回收器負責回收，因此大小和生命週期不需要確定，具有很大的靈活性。

對於字串：其物件的引用都是儲存在棧中的，如果是編譯期已經建立好(直接用雙引號定義的)的就儲存在常量池中，如果是執行期（new出來的）才能確定的就儲存在堆中。對於equals相等的字串，在常量池中永遠只有一份，在堆中有多份。

如以下程式碼： Java程式碼

String s1 = "china";

String s2 = "china";

String s3 = "china";

String ss1 = new String("china");

String ss2 = new String("china");

String ss3 = new String("china");

這裡解釋一下，對於通過 new 產生一個字串（假設為 ”china” ）時，會先去常量池中查詢是否已經有了 ”china” 物件，如果沒有則在常量池中建立一個此字串物件，然後堆中再建立一個常量池中此 ”china” 物件的拷貝物件。

也就是有道面試題： String s = new String(“xyz”); 產生幾個物件？

一個或兩個。如果常量池中原來沒有 ”xyz”, 就是兩個。如果原來的常量池中存在“xyz”時，就是一個。

對於基礎型別的變數和常量：變數和引用儲存在棧中，常量儲存在常量池中。

如以下程式碼： Java程式碼

int i1 = 9;

int i2 = 9;

int i3 = 9;

public static final int INT1 = 9;

public static final int INT2 = 9;

public static final int INT3 = 9;

對於成員變數和區域性變數：成員變數就是方法外部，類的內部定義的變數；

區域性變數就是方法或語句塊內部定義的變數。區域性變數必須初始化。形式引數是區域性變數，區域性變數的資料存在於棧記憶體中。棧記憶體中的區域性變數隨著方法的消失而消失。成員變數儲存在堆中的物件裡面，由垃圾回收器負責回收。

如以下程式碼： Java程式碼

class BirthDate {

private int day;

private int month;

private int year;

public BirthDate(int d, int m, int y) {

day = d;

month = m;

year = y;

}

// 省略get,set方法………

}

public class Test{

public static void main(String args[]){

int date = 9;

Test test = new Test();

test.change(date);

BirthDate d1= new BirthDate(7,7,1970);

}

public void change1(int i){

i = 1234;

}

對於以上這段程式碼，date為區域性變數，i,d,m,y都是形參為區域性變數，day，month，year為成員變數。

下面分析一下程式碼執行時候的變化：

1. main方法開始執行：int date = 9; date區域性變數，基礎型別，引用和值都存在棧中。

2. Test test = new Test(); test為物件引用，存在棧中，物件(new Test())存在堆中。

3. test.change(date); i為區域性變數，引用和值存在棧中。當方法change執行完成後，i就會從棧中消失。

4. BirthDate d1= new BirthDate(7,7,1970); d1 為物件引用，存在棧中，物件(new BirthDate())存在堆中，其中d，m，y為區域性變數儲存在棧中，且它們的型別為基礎型別，因此它們的資料也儲存在棧中。 day,month,year為成員變數，它們儲存在堆中(new BirthDate()裡面)。當BirthDate構造方法執行完之後，d,m,y將從棧中消失。

5.main方法執行完之後，date變數，test，d1引用將從棧中消失，new Test(),new BirthDate()將等待垃圾回收。

Java堆、棧和常量池詳解（二）

1. 棧(stack)與堆(heap)都是Java用來在RAM中存放資料的地方。與C++不同，Java自動管理棧和堆，程式設計師不能直接地設定棧或堆。

2. 棧的優勢是，存取速度比堆要快，僅次於直接位於CPU中的暫存器。但缺點是，存在棧中的資料大小與生存期必須是確定的，缺乏靈活性。另外，棧資料可以共享，詳見第3點。

堆的優勢是可以動態地分配記憶體大小，生存期也不必事先告訴編譯器，Java的垃圾收集器會自動收走這些不再使用的資料。但缺點是，由於要在執行時動態分配記憶體，存取速度較慢。

3. Java中的資料型別有兩種。

一種是基本型別(primitive types), 共有8種，即int, short, long, byte, float, double, boolean, char(注意，並沒有string的基本型別)。這種型別的定義是通過諸如int a = 3; long b = 255L;的形式來定義的，稱為自動變數。值得注意的是，自動變數存的是字面值，不是類的例項，即不是類的引用，這裡並沒有類的存在。如int a = 3; 這裡的a是一個指向int型別的引用，指向3這個字面值。這些字面值的資料，由於大小可知，生存期可知(這些字面值固定定義在某個程式塊裡面，程式塊退出後，欄位值就消失了)，出於追求速度的原因，就存在於棧中。另外，棧有一個很重要的特殊性，就是存在棧中的資料可以共享。假設我們同時定義 int a = 3; int b = 3；編譯器先處理int a = 3；首先它會在棧中建立一個變數為a的引用，然後查詢有沒有字面值為3的地址，沒找到，就開闢一個存放3這個字面值的地址，然後將a指向3的地址。接著處理int b = 3；在建立完b的引用變數後，由於在棧中已經有3這個字面值，便將b直接指向3的地址。這樣，就出現了a與b同時均指向3的情況。特別注意的是，這種字面值的引用與類物件的引用不同。假定兩個類物件的引用同時指向一個物件，如果一個物件引用變數修改了這個物件的內部狀態，那麼另一個對象引用變數也即刻反映出這個變化。相反，通過字面值的引用來修改其值，不會導致另一個指向此字面值的引用的值也跟著改變的情況。如上例，我們定義完a與 b的值後，再令a=4；那麼，b不會等於4，還是等於3。在編譯器內部，遇到a=4；時，它就會重新搜尋棧中是否有4的字面值，如果沒有，重新開闢地址存放4的值；如果已經有了，則直接將a指向這個地址。因此a值的改變不會影響到b的值。

另一種是包裝類資料，如Integer, String, Double等將相應的基本資料型別包裝起來的類。這些類資料全部存在於堆中，Java用new()語句來顯示地告訴編譯器，在執行時才根據需要動態建立，因此比較靈活，但缺點是要佔用更多的時間。

舉例如下： Java程式碼

public class Test {

public static void main(String[] args)

{

int a1=1;

int b1=1;

int c1=2;

int d1=a1+b1;

Integer a = 1;

Integer b = 2;

Integer c = 3;

Integer d = 3;

Integer e = 321;

Integer f = 321;

Long g = 3L;

System.out.println(a1==b1); //true 結果1

System.out.println(c1==d1); //true 結果2

System.out.println(c==d); //true 結果3

System.out.println(e==f); //false 結果4

}

分析：

結果1：a1==b1如上面所述,會在棧中開闢儲存空間存放資料。

結果2：首先它會在棧中建立一個變數為c1的引用，然後查詢有沒有字面值為2的地址，沒找到，就開闢一個存放2這個字面值的地址，然後將c1指向2的地址,d1為兩個字面值相加也為2，由於在棧中已經有2這個字面值，便將d1直接指向2的地址。這樣，就出現了c1與d1同時均指向3的情況。在分析下面結果以前讓我們先對Java自動拆箱和裝箱做個了結：在自動裝箱時，把int變成Integer的時候，是有規則的，當你的int的值在-128-IntegerCache.high(127) 時，返回的不是一個新new出來的Integer物件，而是一個已經快取在堆中的Integer物件，（我們可以這樣理解，系統已經把-128到127之間的Integer快取到一個Integer陣列中去了，如果你要把一個int變成一個Integer物件，首先去快取中找，找到的話直接返回引用給你就行了，不必再新new一個），如果不在-128-IntegerCache.high(127) 時會返回一個新new出來的Integer物件。

結果3：由於3是在範圍內所以是從快取中取資料的，c和d指向同一個物件，結果為true;

結果4：由於321不是在範圍內所以不是從快取中取資料的而是單獨有new物件，e和f並沒有指向同一個物件，結果為false;

4. String是一個特殊的包裝類資料。即可以用String str = new String("abc");的形式來建立，也可以用String str = "abc"；的形式來建立(作為對比，在JDK 5.0之前，你從未見過Integer i = 3;的表示式，因為類與字面值是不能通用的，除了String。而在JDK 5.0中，這種表示式是可以的！因為編譯器在後臺進行Integer i = new Integer(3)的轉換)。前者是規範的類的建立過程，即在Java中，一切都是物件，而物件是類的例項，全部通過new()的形式來建立。Java 中的有些類，如DateFormat類，可以通過該類的getInstance()方法來返回一個新建立的類，似乎違反了此原則。其實不然。該類運用了單例模式來返回類的例項，只不過這個例項是在該類內部通過new()來建立的，而getInstance()向外部隱藏了此細節。那為什麼在String str = "abc"；中，並沒有通過new()來建立例項，是不是違反了上述原則？其實沒有。

4(1)String str = "abc"建立物件的過程 1 首先在常量池中查詢是否存在內容為"abc"字串物件 2 如果不存在則在常量池中建立"abc"，並讓str引用該物件 3 如果存在則直接讓str引用該物件

至於"abc"是怎麼儲存，儲存在哪？常量池屬於類資訊的一部分，而類資訊反映到JVM記憶體模型中是對應存在於JVM記憶體模型的方法區，也就是說這個類資訊中的常量池概念是存在於在方法區中，而方法區是在JVM記憶體模型中的堆中由JVM來分配的，所以"abc"可以說存在於堆中（而有些資料，為了把方法區的堆區別於JVM的堆，把方法區稱為棧）。一般這種情況下，"abc"在編譯時就被寫入位元組碼中，所以class被載入時，JVM就為"abc"在常量池中分配記憶體，所以和靜態區差不多。

4(2)String str = new String("abc")建立例項的過程 1 首先在堆中（不是常量池）建立一個指定的物件"abc"，並讓str引用指向該物件 2 在字串常量池中檢視，是否存在內容為"abc"字串物件 3 若存在，則將new出來的字串物件與字串常量池中的物件聯絡起來 4 若不存在，則在字串常量池中建立一個內容為"abc"的字串物件，並將堆中的物件與之聯絡起來 intern 方法可以返回該字串在常量池中的物件的引用，可以通過下面程式碼簡單的測試 Java程式碼

class StringTest {

public static void main(String[] args) {

String str1 = "abc";

String str2 = new String("abc").intern();

System.out.println(str1==str2);

}

一個初始為空的字串池，它由類 String 私有地維護。當呼叫 intern 方法時，如果池已經包含一個等於此 String 物件的字串（用 equals(Object) 方法確定），則返回池中的字串。否則，將此 String 物件新增到池中，並返回此 String 物件的引用。它遵循以下規則：對於任意兩個字串 s 和 t ，當且僅當 s.equals(t) 為 true 時，s.intern() == t.intern() 才為 true 。所以String str1 = "abc"，str1引用的是常量池（方法區）的物件，而String str2 = new String("abc")，str2引用的是堆中的物件，所以記憶體地址不一樣，但是內容一樣，所以==為false，而equals是true

4(3)String str1 = "abc"; String str2 = "ab" + "c"; str1==str2是ture 是因為String str2 = "ab" + "c"會查詢常量池中時候存在內容為"abc"字串物件，如存在則直接讓str2引用該物件，顯然String str1 = "abc"的時候，上面說了，會在常量池中建立"abc"物件，所以str1引用該物件，str2也引用該物件，所以str1==str2

4(4)String str1 = "abc"; String str2 = "ab"; String str3 = str2 + "c"; str1==str3是false 是因為String str3 = str2 + "c"涉及到變數（不全是常量）的相加，所以會生成新的物件，其內部實現是先new一個StringBuilder，然後 append(str2),append("c");然後讓str3引用toString()返回的物件如果想了解更多的細節，可以自己檢視反編譯的程式碼，檢視反編譯程式碼可以用javap，

即 javap -c -verbose 要檢視的類檔案(.class不要)

比如上面的程式碼的示例

javac StringTest.java //編譯

javap -c -verbose StringTest //反編譯

4(5)String str1 = "abc";

String str2 = "abc";

System.out.println(str1==str2); //true 注意，

我們這裡並不用str1.equals(str2)；的方式，因為這將比較兩個字串的值是否相等。==號，根據JDK的說明，只有在兩個引用都指向了同一個物件時才返回真值。而我們在這裡要看的是，str1與str2是否都指向了同一個物件。結果說明，JVM建立了兩個引用str1和str2，但只建立了一個物件，而且兩個引用都指向了這個物件。

4(6)String str1 = "abc";

String str2 = "abc";

str1 = "bcd";

System.out.println(str1 + "," + str2); //bcd, abc

System.out.println(str1==str2); //false 這就是說，賦值的變化導致了類物件引用的變化，str1指向了另外一個新物件！而str2仍舊指向原來的物件。上例中，當我們將str1的值改為"bcd"時，JVM發現在常量池中沒有存放該值的地址，便開闢了這個地址，並建立了一個新的物件，其字串的值指向這個地址。事實上，String類被設計成為不可改變(immutable)的類。如果你要改變其值，可以，但JVM在執行時根據新值悄悄建立了一個新物件，然後將這個物件的地址返回給原來類的引用。這個建立過程雖說是完全自動進行的，但它畢竟佔用了更多的時間。在對時間要求比較敏感的環境中，會帶有一定的不良影響。

4(7)

String str1 = "abc";

String str2 = "abc";

str1 = "bcd";

String str3 = str1;

System.out.println(str3); //bcd

String str4 = "bcd";

System.out.println(str1 == str4); //true str3 這個物件的引用直接指向str1所指向的物件(注意，str3並沒有建立新物件)。當str1改完其值後，再建立一個String的引用str4，並指向因str1修改值而建立的新的物件。可以發現，這回str4也沒有建立新的物件，從而再次實現棧中資料的共享。

4(8)

我們再接著看以下的程式碼。

String str1 = new String("abc");

String str2 = "abc";

System.out.println(str1==str2); //false 建立了兩個引用。建立了兩個物件。兩個引用分別指向不同的兩個物件。 String str1 = "abc"; String str2 = new String("abc"); System.out.println(str1==str2); //false 建立了兩個引用。建立了兩個物件。兩個引用分別指向不同的兩個物件。以上兩段程式碼說明，只要是用new()來新建物件的，都會在堆中建立，而且其字串是單獨存值的，即使與棧中的資料相同，也不會與棧中的資料共享。

5. 資料型別包裝類的值不可修改。不僅僅是String類的值不可修改，所有的資料型別包裝類都不能更改其內部的值。

6. 結論與建議：

(1) 我們在使用諸如String str = "abc"；的格式定義類時，總是想當然地認為，我們建立了String類的物件str。擔心陷阱！物件可能並沒有被建立！唯一可以肯定的是，指向 String類的引用被建立了。至於這個引用到底是否指向了一個新的物件，必須根據上下文來考慮，除非你通過new()方法來顯要地建立一個新的物件。因此，更為準確的說法是，我們建立了一個指向String類的物件的引用變數str，這個物件引用變數指向了某個值為"abc"的String類。清醒地認識到這一點對排除程式中難以發現的bug是很有幫助的。

(2)使用String str = "abc"；的方式，可以在一定程度上提高程式的執行速度，因為JVM會自動根據棧中資料的實際情況來決定是否有必要建立新物件。而對於String str = new String("abc")；的程式碼，則一概在堆中建立新物件，而不管其字串值是否相等，是否有必要建立新物件，從而加重了程式的負擔。這個思想應該是享元模式的思想，但JDK的內部在這裡實現是否應用了這個模式，不得而知。

(3)當比較包裝類裡面的數值是否相等時，用equals()方法；當測試兩個包裝類的引用是否指向同一個物件時，用==。

(4)由於String類的immutable性質，當String變數需要經常變換其值時，應該考慮使用StringBuffer類，以提高程式效率

Java堆、棧和常量池以及相關String的詳細講解（經典中的經典）

相關文章