Java堆、棧和常量池以及相關String的詳細講解(經典中的經典)

豬哥66發表於2015-09-06

一:在JAVA中,有六個不同的地方可以儲存資料:  

1. 暫存器(register)。 這是最快的儲存區,因為它位於不同於其他儲存區的地方——處理器內部。但是暫存器的數量極其有限,所以暫存器由編譯器根據需求進行分配。你不能直接控制,也不能在程式中感覺到暫存器存在的任何跡象。    

------最快的儲存區, 由編譯器根據需求進行分配,我們在程式中無法控制.

2. 堆疊(stack)。位於通用RAM中,但通過它的“堆疊指標”可以從處理器哪裡獲得支援。堆疊指標若向下移動,則分配新的記憶體;若向上移動,則釋放那些 記憶體。這是一種快速有效的分配儲存方法,僅次於暫存器。建立程式時候,JAVA編譯器必須知道儲存在堆疊內所有資料的確切大小和生命週期,因為它必須生成 相應的程式碼,以便上下移動堆疊指標。這一約束限制了程式的靈活性,所以雖然某些JAVA資料儲存在堆疊中——特別是物件引用,但是JAVA物件不儲存其 中。    

------存放基本型別的變數資料和物件,陣列的引用,但物件本身不存放在棧中,而是存放在堆(new 出來的物件)或者常量池中(字串常量物件存放在常量池中)

3. 堆(heap)。一種通用性的記憶體池(也存在於RAM中),用於存放所以的JAVA物件。堆不同於堆疊的好處是:編譯器不需要知道要從堆裡分配多少儲存區 域,也不必知道儲存的資料在堆裡存活多長時間。因此,在堆裡分配儲存有很大的靈活性。當你需要建立一個物件的時候,只需要new寫一行簡單的程式碼,當執行 這行程式碼時,會自動在堆裡進行儲存分配。當然,為這種靈活性必須要付出相應的程式碼。用堆進行儲存分配比用堆疊進行儲存儲存需要更多的時間。  

------存放所有new出來的物件。

4. 靜態儲存(static storage)。這裡的“靜態”是指“在固定的位置”。靜態儲存裡存放程式執行時一直存在的資料。你可用關鍵字static來標識一個物件的特定元素是靜態的,但JAVA物件本身從來不會存放在靜態儲存空間裡。  

------存放靜態成員(static定義的)

5. 常量儲存(constant storage)。常量值通常直接存放在程式程式碼內部,這樣做是安全的,因為它們永遠不會被改變。有時,在嵌入式系統中,常量本身會和其他部分分割離開,所以在這種情況下,可以選擇將其放在ROM中  

------存放字串常量和基本型別常量(public static final)

6. 非RAM儲存。如果資料完全存活於程式之外,那麼它可以不受程式的任何控制,在程式沒有執行時也可以存在。  

------硬碟等永久儲存空間 就速度來說,有如下關係:

    暫存器 >堆疊 > 堆 > 其它

    這裡我們主要關心棧,堆和常量池,對於棧和常量池中的物件可以共享,對於堆中的物件不可以共享。

     棧中的資料大小和生命週期是可以確定的,當沒有引用指向資料時,這個資料就會消失。堆中的物件的由垃圾回收器負責回收,因此大小和生命週期不需要確定,具有很大的靈活性。    

    對於字串:其物件的引用都是儲存在棧中的,如果是編譯期已經建立好(直接用雙引號定義的)的就儲存在常量池中,如果是執行期(new出來的)才能確定的就儲存在堆中。對於equals相等的字串,在常量池中永遠只有一份,在堆中有多份。

     如以下程式碼: Java程式碼 

        String s1 = "china"; 

        String s2 = "china";

        String s3 = "china"; 

        String ss1 = new String("china"); 

        String ss2 = new String("china"); 

        String ss3 = new String("china");   

        這裡解釋一下,對於通過 new 產生一個字串(假設為 ”china” )時,會先去常量池中查詢是否已經有了 ”china” 物件,如果沒有則在常量池中建立一個此字串物件,然後堆中再建立一個常量池中此 ”china” 物件的拷貝物件。

        也就是有道面試題: String s = new String(“xyz”); 產生幾個物件?

         一個或兩個。如果常量池中原來沒有 ”xyz”, 就是兩個。如果原來的常量池中存在“xyz”時,就是一個。

        對於基礎型別的變數和常量:變數和引用儲存在棧中,常量儲存在常量池中。

        如以下程式碼: Java程式碼 

        int i1 = 9; 

        int i2 = 9; 

        int i3 = 9;  

        public static final int INT1 = 9; 

        public static final int INT2 = 9; 

        public static final int INT3 = 9;   

        對於成員變數和區域性變數:成員變數就是方法外部,類的內部定義的變數;

     區域性變數就是方法或語句塊內部定義的變數。區域性變數必須初始化。 形式引數是區域性變數,區域性變數的資料存在於棧記憶體中。棧記憶體中的區域性變數隨著方法的消失而消失。 成員變數儲存在堆中的物件裡面,由垃圾回收器負責回收。

     如以下程式碼: Java程式碼  

     class BirthDate {     

       private int day;     

       private int month;     

       private int year;         

       public BirthDate(int d, int m, int y) {         

                   day = d;          

                   month = m;          

                    year = y;     

                   }     

     // 省略get,set方法……… 

  }   

 

 public class Test{     

    public static void main(String args[]){ 

      int date = 9;         

      Test test = new Test();                  

      test.change(date);          

      BirthDate d1= new BirthDate(7,7,1970);            

    }         

  public void change1(int i){         

        i = 1234;     

    }   

  對於以上這段程式碼,date為區域性變數,i,d,m,y都是形參為區域性變數,day,month,year為成員變數。

  下面分析一下程式碼執行時候的變化:

  1. main方法開始執行:int date = 9; date區域性變數,基礎型別,引用和值都存在棧中。

  2. Test test = new Test(); test為物件引用,存在棧中,物件(new Test())存在堆中。

  3. test.change(date); i為區域性變數,引用和值存在棧中。當方法change執行完成後,i就會從棧中消失。

  4. BirthDate d1= new BirthDate(7,7,1970);  d1 為物件引用,存在棧中,物件(new BirthDate())存在堆中,其中d,m,y為區域性變數儲存在棧中,且它們的型別為基礎型別,因此它們的資料也儲存在棧中。 day,month,year為成員變數,它們儲存在堆中(new BirthDate()裡面)。當BirthDate構造方法執行完之後,d,m,y將從棧中消失。

  5.main方法執行完之後,date變數,test,d1引用將從棧中消失,new Test(),new BirthDate()將等待垃圾回收。

 

Java堆、棧和常量池詳解(二)

1. 棧(stack)與堆(heap)都是Java用來在RAM中存放資料的地方。與C++不同,Java自動管理棧和堆,程式設計師不能直接地設定棧或堆。

2. 棧的優勢是,存取速度比堆要快,僅次於直接位於CPU中的暫存器。但缺點是,存在棧中的資料大小與生存期必須是確定的,缺乏靈活性。另外,棧資料可以共 享,詳見第3點。    

    堆的優勢是可以動態地分配記憶體大小,生存期也不必事先告訴編譯器,Java的垃圾收集器會自動收走這些不再使用的資料。但缺點是,由於要 在執行時動態分配記憶體,存取速度較慢。

3. Java中的資料型別有兩種。

 一種是基本型別(primitive types), 共有8種,即int, short, long, byte, float, double, boolean, char(注意,並沒有string的基本型別)。這種型別的定義是通過諸如int a = 3; long b = 255L;的形式來定義的,稱為自動變數。值得注意的是,自動變數存的是字面值,不是類的例項,即不是類的引用,這裡並沒有類的存在。如int a = 3; 這裡的a是一個指向int型別的引用,指向3這個字面值。這些字面值的資料,由於大小可知,生存期可知(這些字面值固定定義在某個程式塊裡面,程式塊退出 後,欄位值就消失了),出於追求速度的原因,就存在於棧中。 另外,棧有一個很重要的特殊性,就是存在棧中的資料可以共享。假設我們同時定義   int a = 3;   int b = 3; 編 譯器先處理int a = 3;首先它會在棧中建立一個變數為a的引用,然後查詢有沒有字面值為3的地址,沒找到,就開闢一個存放3這個字面值的地址,然後將a指向3的地址。接著處 理int b = 3;在建立完b的引用變數後,由於在棧中已經有3這個字面值,便將b直接指向3的地址。這樣,就出現了a與b同時均指向3的情況。 特 別注意的是,這種字面值的引用與類物件的引用不同。假定兩個類物件的引用同時指向一個物件,如果一個物件引用變數修改了這個物件的內部狀態,那麼另一個對 象引用變數也即刻反映出這個變化。相反,通過字面值的引用來修改其值,不會導致另一個指向此字面值的引用的值也跟著改變的情況。如上例,我們定義完a與 b的值後,再令a=4;那麼,b不會等於4,還是等於3。在編譯器內部,遇到a=4;時,它就會重新搜尋棧中是否有4的字面值,如果沒有,重新開闢地址存 放4的值;如果已經有了,則直接將a指向這個地址。因此a值的改變不會影響到b的值。

   另一種是包裝類資料,如Integer, String, Double等將相應的基本資料型別包裝起來的類。這些類資料全部存在於堆中,Java用new()語句來顯示地告訴編譯器,在執行時才根據需要動態建立,因此比較靈活,但缺點是要佔用更多的時間。  

   舉例如下: Java程式碼 

   public class Test {       

    public static void main(String[] args)       

    {   

        int a1=1;         

        int b1=1;         

        int c1=2;         

        int d1=a1+b1;         

        Integer a = 1;           

        Integer b = 2;           

        Integer c = 3;           

        Integer d = 3;           

        Integer e = 321;           

        Integer f = 321;

        Long g = 3L;  

       System.out.println(a1==b1);   //true  結果1           

       System.out.println(c1==d1);   //true  結果2         

       System.out.println(c==d);   //true  結果3            

       System.out.println(e==f);   //false  結果4          

      }  

  }   

 分析:

   結果1:a1==b1如上面所述,會在棧 中開闢儲存空間存放資料。          

   結果2:首先它會在棧 中建立一個變數為c1的引用,然後查詢有沒有字面值為2的地址,沒找到,就開闢一個存放2這個字面值的地址,然後將c1指向2的地址,d1為兩個字面值相加也為2, 由於在棧中已經有2這個字面值,便將d1直接指向2的地址。這樣,就出現了c1與d1同時均指向3的情況。           在分析下面結果以前讓我們先對Java自動拆箱和裝箱做個了結:在自動裝箱時,把int變成Integer的時候,是有規則的,當你的int的值在-128-IntegerCache.high(127) 時,返回的不是一個新new出來的Integer物件,而是一個已經快取在堆 中的Integer物件,(我們可以這樣理解,系統已經把-128到127之 間的Integer快取到一個Integer陣列中去了,如果你要把一個int變成一個Integer物件,首先去快取中找,找到的話直接返回引用給你就 行了,不必再新new一個),如果不在-128-IntegerCache.high(127) 時會返回一個新new出來的Integer物件。           

  結果3:由於3是在範圍內所以是從快取中取資料的,c和d指向同一個物件,結果為true;         

  結果4:由於321不是在範圍內所以不是從快取中取資料的而是單獨有new物件,e和f並沒有指向同一個物件,結果為false;  

  4. String是一個特殊的包裝類資料。即可以用String str = new String("abc");的形式來建立,也可以用String str = "abc";的形式來建立(作為對比,在JDK 5.0之前,你從未見過Integer i = 3;的表示式,因為類與字面值是不能通用的,除了String。而在JDK 5.0中,這種表示式是可以的!因為編譯器在後臺進行Integer i = new Integer(3)的轉換)。前者是規範的類的建立過程,即在Java中,一切都是物件,而物件是類的例項,全部通過new()的形式來建立。Java 中的有些類,如DateFormat類,可以通過該類的getInstance()方法來返回一個新建立的類,似乎違反了此原則。其實不然。該類運用了單 例模式來返回類的例項,只不過這個例項是在該類內部通過new()來建立的,而getInstance()向外部隱藏了此細節。那為什麼在String str = "abc";中,並沒有通過new()來建立例項,是不是違反了上述原則?其實沒有。

   4(1)String str = "abc"建立物件的過程 1 首先在常量池中查詢是否存在內容為"abc"字串物件 2 如果不存在則在常量池中建立"abc",並讓str引用該物件 3 如果存在則直接讓str引用該物件

至 於"abc"是怎麼儲存,儲存在哪?常量池屬於類資訊的一部分,而類資訊反映到JVM記憶體模型中是對應存在於JVM記憶體模型的方法區,也就是說這個類資訊 中的常量池概念是存在於在方法區中,而方法區是在JVM記憶體模型中的堆中由JVM來分配的,所以"abc"可以說存在於堆中(而有些資料,為了把方法區的 堆區別於JVM的堆,把方法區稱為棧)。一般這種情況下,"abc"在編譯時就被寫入位元組碼中,所以class被載入時,JVM就為"abc"在常量池中 分配記憶體,所以和靜態區差不多。  

   4(2)String str = new String("abc")建立例項的過程 1 首先在堆中(不是常量池)建立一個指定的物件"abc",並讓str引用指向該物件 2 在字串常量池中檢視,是否存在內容為"abc"字串物件 3 若存在,則將new出來的字串物件與字串常量池中的物件聯絡起來 4 若不存在,則在字串常量池中建立一個內容為"abc"的字串物件,並將堆中的物件與之聯絡起來 intern 方法可以返回該字串在常量池中的物件的引用,可以通過下面程式碼簡單的測試 Java程式碼 

  class StringTest {     

   public static void main(String[] args) {         

    String str1 = "abc";         

    String str2 = new String("abc").intern();         

    System.out.println(str1==str2);     

  } 

  一個初始為空的字串池,它由類 String 私有地維護。 當呼叫 intern 方法時,如果池已經包含一個等於此 String 物件的字串(用 equals(Object) 方法確定),則返回池中的字串。否則,將此 String 物件新增到池中,並返回此 String 物件的引用。 它遵循以下規則:對於任意兩個字串 s 和 t ,當且僅當  s.equals(t) 為 true 時,s.intern() == t.intern() 才為 true 。   所以String str1 = "abc",str1引用的是常量池(方法區)的物件,而String str2 = new String("abc"),str2引用的是堆中的物件,所以記憶體地址不一樣,但是內容一樣,所以==為false,而equals是true

4(3)String str1 = "abc"; String str2 = "ab" + "c"; str1==str2是ture 是因為String str2 = "ab" + "c"會查詢常量池中時候存在內容為"abc"字串物件,如存在則直接讓str2引用該物件,顯然String str1 = "abc"的時候,上面說了,會在常量池中建立"abc"物件,所以str1引用該物件,str2也引用該物件,所以str1==str2

4(4)String str1 = "abc"; String str2 = "ab"; String str3 = str2 + "c"; str1==str3是false 是因為String str3 = str2 + "c"涉及到變數(不全是常量)的相加,所以會生成新的物件,其內部實現是先new一個StringBuilder,然後 append(str2),append("c");然後讓str3引用toString()返回的物件 如果想了解更多的細節,可以自己檢視反編譯的程式碼,檢視反編譯程式碼可以用javap,

 即 javap -c -verbose 要檢視的類檔案(.class不要)

比如上面的程式碼的示例

javac StringTest.java //編譯

javap -c -verbose StringTest //反編譯

4(5)String str1 = "abc";

      String str2 = "abc";

     System.out.println(str1==str2);  //true 注意,

     我們這裡並不用str1.equals(str2);的方式,因為這將比較兩個字串的值是否相等。==號,根據JDK的說明,只有在兩個引用都指向了同一個物件時才返回真值。而我們在這裡要看的是,str1與str2是否都指向了同一個物件。 結果說明,JVM建立了兩個引用str1和str2,但只建立了一個物件,而且兩個引用都指向了這個物件。

4(6)String str1 = "abc";

      String str2 = "abc";

       str1 = "bcd";

       System.out.println(str1 + "," + str2);  //bcd, abc      

       System.out.println(str1==str2);  //false 這就是說,賦值的變化導致了類物件引用的變化,str1指向了另外一個新物件!而str2仍舊指向原來的物件。上例中,當我們將str1的值改為"bcd"時,JVM發現在 常量池中沒有存放該值的地址,便開闢了這個地址,並建立了一個新的物件,其字串的值指向這個地址。 事 實上,String類被設計成為不可改變(immutable)的類。如果你要改變其值,可以,但JVM在執行時根據新值悄悄建立了一個新物件,然後將這 個物件的地址返回給原來類的引用。這個建立過程雖說是完全自動進行的,但它畢竟佔用了更多的時間。在對時間要求比較敏感的環境中,會帶有一定的不良影響。

 4(7)

     String str1 = "abc";

     String str2 = "abc";

               str1 = "bcd";      

     String str3 = str1;      

     System.out.println(str3);  //bcd      

     String str4 = "bcd";    

     System.out.println(str1 == str4);  //true str3 這個物件的引用直接指向str1所指向的物件(注意,str3並沒有建立新物件)。當str1改完其值後,再建立一個String的引用str4,並指向 因str1修改值而建立的新的物件。可以發現,這回str4也沒有建立新的物件,從而再次實現棧中資料的共享。

 4(8)

   我們再接著看以下的程式碼。  

  String str1 = new String("abc");

  String str2 = "abc";

  System.out.println(str1==str2);  //false 建立了兩個引用。建立了兩個物件。兩個引用分別指向不同的兩個物件。   String str1 = "abc";   String str2 = new String("abc");   System.out.println(str1==str2);  //false 建立了兩個引用。建立了兩個物件。兩個引用分別指向不同的兩個物件。 以上兩段程式碼說明,只要是用new()來新建物件的,都會在堆中建立,而且其字串是單獨存值的,即使與棧中的資料相同,也不會與棧中的資料共享。

5. 資料型別包裝類的值不可修改。不僅僅是String類的值不可修改,所有的資料型別包裝類都不能更改其內部的值。

6. 結論與建議:

  (1) 我們在使用諸如String str = "abc";的格式定義類時,總是想當然地認為,我們建立了String類的物件str。擔心陷阱!物件可能並沒有被建立!唯一可以肯定的是,指向 String類的引用被建立了。至於這個引用到底是否指向了一個新的物件,必須根據上下文來考慮,除非你通過new()方法來顯要地建立一個新的物件。因 此,更為準確的說法是,我們建立了一個指向String類的物件的引用變數str,這個物件引用變數指向了某個值為"abc"的String類。清醒地認 識到這一點對排除程式中難以發現的bug是很有幫助的。

(2)使用String str = "abc";的方式,可以在一定程度上提高程式的執行速度,因為JVM會自動根據棧中資料的實際情況來決定是否有必要建立新物件。而對於String str = new String("abc");的程式碼,則一概在堆中建立新物件,而不管其字串值是否相等,是否有必要建立新物件,從而加重了程式的負擔。這個思想應該是 享元模式的思想,但JDK的內部在這裡實現是否應用了這個模式,不得而知。

(3)當比較包裝類裡面的數值是否相等時,用equals()方法;當測試兩個包裝類的引用是否指向同一個物件時,用==。

(4)由於String類的immutable性質,當String變數需要經常變換其值時,應該考慮使用StringBuffer類,以提高程式效率 

相關文章