java記憶體分配

lostinai發表於2014-05-27

http://www.cnblogs.com/yyyyy5101/archive/2011/03/23/1992438.html

  • 棧、堆、常量池雖同屬Java記憶體分配時操作的區域,但其適用範圍和功用卻大不相同。本文將深入Java核心,詳細講解Java記憶體分配方面的知識。

Java記憶體分配與管理是Java的核心技術之一,之前我們曾介紹過Java的記憶體管理與記憶體洩露以及Java垃圾回收方面的知識,今天我們再次深入Java核心,詳細介紹一下Java在記憶體分配方面的知識。一般Java在記憶體分配時會涉及到以下區域:

◆暫存器:我們在程式中無法控制

◆棧:存放基本型別的資料和物件的引用,但物件本身不存放在棧中,而是存放在堆中

◆堆:存放用new產生的資料

◆靜態域:存放在物件中用static定義的靜態成員

◆常量池:存放常量

◆非RAM儲存:硬碟等永久儲存空間

Java記憶體分配中的棧

在函式中定義的一些基本型別的變數資料和物件的引用變數都在函式的棧記憶體中分配。
 
當在一段程式碼塊定義一個變數時,Java就在棧中 為這個變數分配記憶體空間,當該變數退出該作用域後,Java會自動釋放掉為該變數所分配的記憶體空間,該記憶體空間可以立即被另作他用。

Java記憶體分配中的堆

堆記憶體用來存放由new建立的物件和陣列。 在堆中分配的記憶體,由Java虛擬機器的自動垃圾回收器來管理。

在堆中產生了一個陣列或物件後,還可以 在棧中定義一個特殊的變數,讓棧中這個變數的取值等於陣列或物件在堆記憶體中的首地址,棧中的這個變數就成了陣列或物件的引用變數。  引用變數就相當於是 為陣列或物件起的一個名稱,以後就可以在程式中使用棧中的引用變數來訪問堆中的陣列或物件。引用變數就相當於是為陣列或者物件起的一個名稱。

引用變數是普通的變數,定義時在棧中分配,引用變數在程式執行到其作用域之外後被釋放。而陣列和物件本身在堆中分配,即使程式 執行到使用 new 產生陣列或者物件的語句所在的程式碼塊之外,陣列和物件本身佔據的記憶體不會被釋放,陣列和物件在沒有引用變數指向它的時候,才變為垃圾,不能在被使用,但仍 然佔據記憶體空間不放,在隨後的一個不確定的時間被垃圾回收器收走(釋放掉)。這也是 Java 比較佔記憶體的原因。

實際上,棧中的變數指向堆記憶體中的變數,這就是Java中的指標
 
常量池 (constant pool)

常量池指的是在編譯期被確定,並被儲存在已編譯的.class檔案中的一些資料。除了包含程式碼中所定義的各種基本型別(如int、long等等)和物件型(如String及陣列)的常量值(final)還包含一些以文字形式出現的符號引用,比如:

◆類和介面的全限定名;

◆欄位的名稱和描述符;

◆方法和名稱和描述符。

虛擬機器必須為每個被裝載的型別維護一個常量池。常量池就是該型別所用到常量的一個有序集和,包括直接常量(string,integer和 floating point常量)和對其他型別,欄位和方法的符號引用。

對於String常量,它的值是在常量池中的。而JVM中的常量池在記憶體當中是以表的形式存在的, 對於String型別,有一張固定長度的CONSTANT_String_info表用來儲存文字字串值,注意:該表只儲存文字字串值,不儲存符號引 用。說到這裡,對常量池中的字串值的儲存位置應該有一個比較明瞭的理解了。
在程式執行的時候,常量池 會儲存在Method Area,而不是堆中。

堆與棧

Java的堆是一個執行時資料區,類的(物件從中分配空間。這些物件通過new、newarray、 anewarray和multianewarray等指令建立,它們不需要程式程式碼來顯式的釋放。堆是由垃圾回收來負責的,堆的優勢是可以動態地分配記憶體 大小,生存期也不必事先告訴編譯器,因為它是在執行時動態分配記憶體的,Java的垃圾收集器會自動收走這些不再使用的資料。但缺點是,由於要在執行時動態 分配記憶體,存取速度較慢。

棧的優勢是,存取速度比堆要快,僅次於暫存器,棧資料可以共享。但缺點是,存在棧中的資料大小與生存期必須是 確定的,缺乏靈活性。棧中主要存放一些基本型別的變數資料(int, short, long, byte, float, double, boolean, char)和物件控制程式碼(引用)。

棧有一個很重要的特殊性,就是存在棧中的資料可以共享。假設我們同時定義:

int a =  3;

int b =  3;

編譯器先處理int a = 3;首先它會在棧中建立一個變數為a的引用,然後查詢棧中是否有3這個值,如果沒找到,就將3存放進來,然後將a指向3。接著處理int b = 3;在建立完b的引用變數後,因為在棧中已經有3這個值,便將b直接指向3。這樣,就出現了a與b同時均指向3的情況。

這時,如果再令 a=4;那麼編譯器會重新搜尋棧中是否有4值,如果沒有,則將4存放進來,並令a指向4;如果已經有了,則直接將a指向這個地址。因此a值的改變不會影響 到b的值。

要注意這種資料的共享與兩個物件的引用同時指向一個物件的這種共享是不同的,因為這種情況a的修改並不會影響到b, 它是由編譯器完成的,它有利於節省空間。而一個物件引用變數修改了這個物件的內部狀態,會影響到另一個物件引用變數。

String是一個特殊的包裝類資料。可以用

String str = new String("abc");  

String str = "abc"

兩種的形式來建立,第一種是用new()來新建物件的,它會在存放於堆中。每呼叫一次就會建立一個新的物件。而第二種是先在棧中建立一個對String類的物件引用變數str,然後通過符號引用去字串常量池 裡找有沒有"abc",如果沒有,則將"abc"存放進字串常量池 ,並令str指向”abc”,如果已經有”abc” 則直接令str指向“abc”。

比較類裡面的數值是否相等時,用equals()方法;當測試兩個包裝類的引用是否指向同一個物件時,用==,下面用例子說明上面的理論。

String str1 = "abc";  

String str2 = "abc";  

System.out.println(str1==str2); //true 

可以看出str1和str2是指向同一個物件的。

String str1 =new String ("abc");  

String str2 =new String ("abc");  

System.out.println(str1==str2); // false

用new的方式是生成不同的物件。每一次生成一個。

因此用第二種方式建立多個”abc”字串,在記憶體中 其實只存在一個物件而已. 這種寫法有利與節省記憶體空間. 同時它可以在一定程度上提高程式的執行速度,因為JVM會自動根據棧中資料的實際情況來決定是否有必要建立新物件。而對於String str = new String("abc");的程式碼,則一概在堆中建立新物件,而不管其字串值是否相等,是否有必要建立新物件,從而加重了程式的負擔。

另 一方面, 要注意: 我們在使用諸如String str = "abc";的格式定義類時,總是想當然地認為,建立了String類的物件str。擔心陷阱!物件可能並沒有被建立!而可能只是指向一個先前已經建立的 物件。只有通過new()方法才能保證每次都建立一個新的物件。
 
由於String類的immutable性質,當String變數需要經常變換 其值時,應該考慮使用StringBuffer類,以提高程式效率。
 
1. 首先String不屬於8種基本資料型別,String是一個物件。因為物件的預設值是null,所以String的預設值也是null;但它又是一種特殊的物件,有其它物件沒有的一些特性。

2. new String()和new String(”")都是申明一個新的空字串,是空串不是null;

3. String str=”kvill”;String str=new String (”kvill”)的區別

示例:

String s0="kvill";  

String s1="kvill";  

String s2="kv" + "ill";  

System.out.println( s0==s1 );  

System.out.println( s0==s2 ); 

結果為:

true
true

首先,我們要知結果為道Java 會確保一個字串常量只有一個拷貝。

因為例子中的 s0和s1中的”kvill”都是字串常量,它們在編譯期就被確定了,所以s0==s1為true;而”kv”和”ill”也都是字串常量,當一個字 符串由多個字串常量連線而成時,它自己肯定也是字串常量,所以s2也同樣在編譯期就被解析為一個字串常量,所以s2也是常量池中” kvill”的一個引用。所以我們得出s0==s1==s2;用new String() 建立的字串不是常量,不能在編譯期就確定,所以new String() 建立的字串不放入常量池中,它們有自己的地址空間。

示例:

  1. String s0="kvill";   
  2. String s1=new String("kvill");   
  3. String s2="kv" + new String("ill");   
  4. System.out.println( s0==s1 );   
  5. System.out.println( s0==s2 );   
  6. System.out.println( s1==s2 );  

結果為:

false
false
false

例2中s0還是常量池 中"kvill”的應用,s1因為無法在編譯期確定,所以是執行時建立的新物件”kvill”的引用,s2因為有後半部分 new String(”ill”)所以也無法在編譯期確定,所以也是一個新建立物件”kvill”的應用;明白了這些也就知道為何得出此結果了。

4. String.intern():

再補充介紹一點:存在於.class檔案中的常量池,在執行期被JVM裝載,並且可以擴充。String的 intern()方法就是擴充常量池的 一個方法;當一個String例項str呼叫intern()方法時,Java 查詢常量池中 是否有相同Unicode的字串常量,如果有,則返回其的引用,如果沒有,則在常 量池中增加一個Unicode等於str的字串並返回它的引用;看示例就清楚了

示例:

  1. String s0= "kvill";   
  2. String s1=new String("kvill");   
  3. String s2=new String("kvill");   
  4. System.out.println( s0==s1 );   
  5. System.out.println( "**********" );   
  6. s1.intern();   
  7. s2=s2.intern(); //把常量池中"kvill"的引用賦給s2   
  8. System.out.println( s0==s1);   
  9. System.out.println( s0==s1.intern() );   
  10. System.out.println( s0==s2 );  

結果為:

false
false //雖然執行了s1.intern(),但它的返回值沒有賦給s1
true //說明s1.intern()返回的是常量池中"kvill"的引用
true

最後我再破除一個錯誤的理解:有人說,“使用 String.intern() 方法則可以將一個 String 類的儲存到一個全域性 String 表中 ,如果具有相同值的 Unicode 字串已經在這個表中,那麼該方法返回表中已有字串的地址,如果在表中沒有相同值的字串,則將自己的地址註冊到表中”如果我把他說的這個全域性的 String 表理解為常量池的話,他的最後一句話,”如果在表中沒有相同值的字串,則將自己的地址註冊到表中”是錯的:

示例:

  1. String s1=new String("kvill");   
  2. String s2=s1.intern();   
  3. System.out.println( s1==s1.intern() );   
  4. System.out.println( s1+" "+s2 );   
  5. System.out.println( s2==s1.intern() );  

結果:

false
kvill kvill
true

在這個類中我們沒有聲名一個”kvill”常量,所以常量池中一開始是沒有”kvill”的,當我們呼叫s1.intern()後就在常量池中新新增了一 個”kvill”常量,原來的不在常量池中的”kvill”仍然存在,也就不是“將自己的地址註冊到常量池中”了。

s1==s1.intern() 為false說明原來的”kvill”仍然存在;s2現在為常量池中”kvill”的地址,所以有s2==s1.intern()為true。

5. 關於equals()和==:

這個對於String簡單來說就是比較兩字串的Unicode序列是否相當,如果相等返回true;而==是 比較兩字串的地址是否相同,也就是是否是同一個字串的引用。

6. 關於String是不可變的

這一說又要說很多,大家只 要知道String的例項一旦生成就不會再改變了,比如說:String str=”kv”+”ill”+” “+”ans”; 就是有4個字串常量,首先”kv”和”ill”生成了”kvill”存在記憶體中,然後”kvill”又和” ” 生成 “kvill “存在記憶體中,最後又和生成了”kvill ans”;並把這個字串的地址賦給了str,就是因為String的”不可變”產生了很多臨時變數,這也就是為什麼建議用StringBuffer的原 因了,因為StringBuffer是可改變的。

下面是一些String相關的常見問題:

String中的final用法和理解

final StringBuffer a = new StringBuffer("111");
final StringBuffer b = new StringBuffer("222");
a=b;//此句編譯不通過
final StringBuffer a = new StringBuffer("111");
a.append("222");// 編譯通過

可見,final只對引用的"值"(即記憶體地址)有效,它迫使引用只能指向初始指向的那個物件,改變它的指向會導致編譯期錯誤。至於它所指向的物件 的變化,final是不負責的。

String常量池問題的幾個例子

下面是幾個常見例子的比較分析和理解:

  1. String a = "a1";   
  2. String b = "a" + 1;   
  3. System.out.println((a == b)); //result = true  
  4. String a = "atrue";   
  5. String b = "a" + "true";   
  6. System.out.println((a == b)); //result = true  
  7. String a = "a3.4";   
  8. String b = "a" + 3.4;   
  9. System.out.println((a == b)); //result = true 

分析:JVM對於字串常量的"+"號連線,將程式編譯期,JVM就將常量字串的"+"連線優化為連線後的值,拿"a" + 1來說,經編譯器優化後在class中就已經是a1。在編譯期其字串常量的值就確定下來,故上面程式最終的結果都為true。

  1. String a = "ab";   
  2. String bb = "b";   
  3. String b = "a" + bb;   
  4. System.out.println((a == b)); //result = false 

分析:JVM對於字串引用,由於在字串的"+"連線中,有字串引用存在,而引用的值在程式編譯期是無法確定的,即"a" + bb無法被編譯器優化,只有在程式執行期來動態分配並將連線後的新地址賦給b。所以上面程式的結果也就為false。

  1. String a = "ab";   
  2. final String bb = "b";   
  3. String b = "a" + bb;   
  4. System.out.println((a == b)); //result = true 

分析:和[3]中唯一不同的是bb字串加了final修飾,對於final修飾的變數,它在編譯時被解析為常量值的一個本地拷貝儲存到自己的常量 池中或嵌入到它的位元組碼流中。所以此時的"a" + bb和"a" + "b"效果是一樣的。故上面程式的結果為true。

  1. String a = "ab";   
  2. final String bb = getBB();   
  3. String b = "a" + bb;   
  4. System.out.println((a == b)); //result = false   
  5. private static String getBB() {  
  6. return "b";   

分析:JVM對於字串引用bb,它的值在編譯期無法確定,只有在程式執行期呼叫方法後,將方法的返回值和"a"來動態連線並分配地址為b,故上面 程式的結果為false。

通過上面4個例子可以得出得知:

String  s  =  "a" + "b" + "c";
 
就等價於String s = "abc";  

String  a  =  "a";  
String  b  =  "b";  
String  c  =  "c";  
String  s  =   a  +  b  +  c; 

這個就不一樣了,最終結果等於: 

  1. StringBuffer temp = new StringBuffer();     
  2. temp.append(a).append(b).append(c);     
  3. String s = temp.toString(); 

由上面的分析結果,可就不難推斷出String 採用連線運算子(+)效率低下原因分析,形如這樣的程式碼:

  1. public class Test {  
  2. public static void main(String args[]) {  
  3. String s = null;  
  4. for(int i = 0; i < 100; i++) {  
  5. s += "a";  
  6. }  
  7. }  

每做一次 + 就產生個StringBuilder物件,然後append後就扔掉。下次迴圈再到達時重新產生個StringBuilder物件,然後 append 字串,如此迴圈直至結束。如果我們直接採用 StringBuilder 物件進行 append 的話,我們可以節省 N - 1 次建立和銷燬物件的時間。所以對於在迴圈中要進行字串連線的應用,一般都是用StringBuffer或StringBulider物件來進行 append操作。

String物件的intern方法理解和分析:

  1. public class Test4 {  
  2. private static String a = "ab";   
  3. public static void main(String[] args){  
  4. String s1 = "a";  
  5. String s2 = "b";  
  6. String s = s1 + s2;  
  7. System.out.println(s == a);//false  
  8. System.out.println(s.intern() == a);//true    
  9. }  

這裡用到Java裡面是一個常量池的問題。對於s1+s2操作,其實是在堆裡面重新建立了一個新的物件,s儲存的是這個新物件在堆空間的的內容,所 以s與a的值是不相等的。而當呼叫s.intern()方法,卻可以返回s在常量池中的地址值,因為a的值儲存在常量池中,故s.intern和a的值相等。



總結

棧中用來存放一些原始資料型別的區域性變數資料和物件的引用(String,陣列.物件等等)但不存放物件內容

堆中存放使用new關鍵字建立的物件.

字串是一個特殊包裝類,其引用是存放在棧裡的,而物件內容必須根據建立方式不同定(常量池和堆).有的是編譯期就已經建立好,存放在字串常 量池中,而有的是執行時才被建立.使用new關鍵字,存放在堆中。


相關文章