new String("abc")建立了幾個物件
面試官考察點猜想
這種問題,考察你對JVM的理解程度。涉及到常量池、物件記憶體分配等問題。
涉及背景知識詳解
在分析這個問題之前,我們先來了解一下JVM的組成,如圖所示。
在JVM1.8中,記憶體劃分為堆、程式計數器、本地方發棧、方法區(元空間)、虛擬機器棧。
JVM知識點普及
下面分別解釋一下JVM執行時記憶體的功能。
堆記憶體空間
堆是 JVM 記憶體中最大的一塊記憶體空間,該記憶體被所有執行緒共享,幾乎所有物件和陣列都被分配到了堆記憶體中。堆被劃分為新生代和老年代,新生代又被進一步劃分為 Eden 和 Survivor 區,最後 Survivor 由 From Survivor 和 To Survivor 組成。
但需要注意的是,這些區域的劃分因不同的垃圾收集器而不同。大部分垃圾收集器都是基於分代收集理論設計的,就會採用這種分代模型。而一些新的垃圾收集器不採用分代設計,比如 G1 收集器就是把堆記憶體拆分為多個大小相等的 Region。
方法區
在 jdk8 之前,HotSopt 虛擬機器的方法區又被稱為永久代,由於永久代的設計容易導致記憶體溢位等問題,jdk8 之後就沒有永久代了,取而代之的是元空間(MetaSpace)。元空間並沒有處於堆記憶體上,而是直接佔用的本地記憶體,因此元空間的最大大小受本地記憶體限制。
方法區與堆空間類似,是所有執行緒共享的。方法區主要是用來存放已被虛擬機器載入的型別資訊、常量、靜態變數等資料。方法區是一個邏輯分割槽,包含元空間、執行時常量池、字串常量池,元空間物理上使用的本地記憶體,執行時常量池和字串常量池是在堆中開闢的一塊特殊記憶體區域。這樣做的好處之一是可以避免執行時動態生成的常量的複製遷移,可以直接使用堆中的引用。
要注意的是,字串常量池在JVM中只有一個,而執行時常量池是和型別資料繫結的,每個Class一個。
- 每個class的位元組碼檔案中都有一個常量池,裡面是編譯後即知的該class會用到的
字面量
與符號引用
,這就是class檔案常量池
。JVM載入class,會將其類資訊,包括class檔案常量池置於方法區中。 - class類資訊及其class檔案常量池是位元組碼的二進位制流,它代表的是一個類的靜態儲存結構,JVM載入類時,需要將其轉換為方法區中的
java.lang.Class
類的物件例項;同時,會將class檔案常量池中的內容匯入執行時常量池
。 - 執行時常量池中的常量對應的內容只是字面量,比如一個"字串",它還不是String物件;當Java程式在執行時執行到這個"字串"字面量時,會去
字串常量池
裡找該字面量的物件引用是否存在,存在則直接返回該引用,不存在則在Java堆裡建立該字面量對應的String物件,並將其引用置於字串常量池中,然後返回該引用。 - Java的基本資料型別中,除了兩個浮點數型別,其他的基本資料型別都在各自內部實現了常量池,但都在[-128~127]這個範圍內。
虛擬機器棧
每當啟動一個新的執行緒,虛擬機器都會在虛擬機器棧裡為它分配一個執行緒棧,執行緒棧與執行緒同生共死。執行緒棧以棧幀為單位儲存執行緒的執行狀態,虛擬機器只會對執行緒棧執行兩種操作:以棧幀為單位的壓棧或出棧。每個方法在執行的同時都會建立一個棧幀,每個方法從呼叫開始到結束,就對應著一個棧幀線上程棧中壓棧和出棧的過程。方法可以通過兩種方式結束,一種通過 return 正常返回,一種通過丟擲異常而終止。方法返回後,虛擬機器都會彈出當前棧幀然後釋放掉。
當虛擬機器呼叫一個Java方法時.它從對應類的型別資訊中得到此方法的區域性變數區和運算元棧的大小,並據此分配棧幀記憶體,然後壓入Java棧中。
棧幀由三部分組成:區域性變數區、運算元棧、幀資料區。
1)區域性變數區:
- 區域性變數區是一個陣列結構,主要存放對應方法的引數和區域性變數。
- 如果是例項方法,區域性變數表第一個引數是一個 reference 引用型別,存放的是當前物件本身 this。
2)運算元棧:
- 運算元棧也是一個陣列結構,但並不是通過索引來訪問的,而是棧的壓棧和出棧操作。
- 運算元棧是虛擬機器的工作區,大多數指令都要從這裡彈出資料、執行運算、然後把結果壓回運算元棧。
3)動態連結:
-
每個棧幀內部都包含一個指向當前方法所在型別的執行時常量池的引用,以便對當前方法的程式碼實現動態連結。
-
在class檔案裡面,一個方法若要呼叫其他方法,或者訪問成員變數,則需要通過符號引用來表示,動態連結的作用就是將這些以符號引用所表示的方法轉換為對實際方法的直接引用。
4)方法返回:
- 方法執行後,有兩種方式退出該方法:正常呼叫完成,執行返回指令。異常呼叫完成,遇到未捕獲異常,不會有方法返回值給呼叫者。
本地方法棧
本地方法棧與虛擬機器棧所發揮的作用是相似的,當執行緒呼叫Java方法時,會建立一個棧幀並壓入虛擬機器棧;而呼叫本地方法時,虛擬機器會保持棧不變,不會壓入新的棧幀,虛擬機器只是簡單的動態連結並直接呼叫指定的本地方法,使用的是某種本地方法棧。比如某個虛擬機器實現的本地方法介面是使用C連線模型,那麼它的本地方法棧就是C棧。
本地方法可以通過本地方法介面來訪問虛擬機器的執行時資料區,它可以做任何他想做的事情,本地方法不受虛擬機器控制。
程式計數器
每一個執行的執行緒都會有它的程式計數器(PC暫存器),與執行緒的生命週期一樣。執行某個方法時,PC暫存器的內容總是下一條將被執行的地址,這個地址可以是一個本地指標,也可以是在方法位元組碼中相對於該方法起始指令的偏移量。如果該執行緒正在執行一個本地方法,那麼此時PC暫存器的值是 undefined。
程式計數器是程式控制流的指示器,分支、迴圈、跳轉、異常處理、執行緒恢復等基礎功能都需要依賴這個計數器來完成。多執行緒環境下,為了執行緒切換後能恢復到正確的執行位置,每條執行緒都需要有一個獨立的程式計數器,各條執行緒之間計數器互不影響,獨立儲存。
程式碼在JVM記憶體中的體現
當我們通過Object o=new Object()
建立一個物件時,在JVM中會分配一塊記憶體用來儲存該物件的資訊,實現原理如下圖所示。
在main方法中,建立了一個區域性變數o
,當main方法執行時,首先會把main方法壓入到棧幀中,接著執行該方法的Object o =new Object()
建立物件。
- 在區域性變數表中建立一個區域性變數
o
。 - 在堆記憶體中分配一塊記憶體地址,用來儲存
object
物件。 - 變數
o
指向堆記憶體中的記憶體地址。
我們再來看一個例子,宣告一個Person物件,在該物件中存在一個常量name
、以及一個成員變數age
,當執行該類中的main
方法時,此時JVM記憶體中的執行情況如下。
在這個例子中,看到了常量池的出現,看來,還有必要了解一下常量池的知識
JVM中的常量池
在JVM中,常量池主要分為:Class檔案常量池、執行時常量池,當然還有全域性字串常量池,以及基本型別包裝類物件常量池。
常量池主要存放兩大類常量:字面量和符號引用。
- 字面量:字面量主要是文字字串、final 常量值、類名和方法名的常量等。
- 符號引用:符號引用對java動態連線起著非常重要的作用。主要的符號引用有:類和介面的全限定名、欄位的名稱和描述符、方法的名稱和描述符等。
Class檔案常量池
class檔案是一組以8位位元組為單位的二進位制資料流,在java程式碼的編譯期間,我們編寫的.java檔案就被編譯為.class檔案格式的二進位制資料存放在磁碟中,其中就包括class檔案常量池。
為了更好的說明,我們通過下面這段程式碼為例進行講解。
class ConstantExample{
private int value = 1;
public String s = "abc";
public final static int f = 0x101;
public void setValue(int v){
final int temp = 3;
this.value = temp + v;
}
public int getValue(){
return value;
}
}
這段程式碼被編譯後,通過javap -v
命令檢視編譯後的位元組碼。
從下面這個位元組碼資訊中可以看到,執行這個命令之後我們得到了該class檔案的版本號、常量池、已經編譯後的位元組碼指令(處於篇幅原因這裡省略),下面我們會對照這個class檔案來講解:
example/target/classes/HelloExample.class
Last modified 2021-10-25; size 734 bytes
MD5 checksum fd06c1426f4fdef12aa109ee7f010a45
Compiled from "HelloExample.java"
public class HelloExample
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #6.#32 // java/lang/Object."<init>":()V
#2 = Fieldref #5.#33 // HelloExample.value:I
#3 = String #34 // abc
#4 = Fieldref #5.#35 // HelloExample.s:Ljava/lang/String;
#5 = Class #36 // HelloExample
#6 = Class #37 // java/lang/Object
#7 = Utf8 value
#8 = Utf8 I
#9 = Utf8 s
#10 = Utf8 Ljava/lang/String;
#11 = Utf8 f
#12 = Utf8 ConstantValue
#13 = Integer 257
#14 = Utf8 <init>
#15 = Utf8 ()V
#16 = Utf8 Code
#17 = Utf8 LineNumberTable
#18 = Utf8 LocalVariableTable
#19 = Utf8 this
#20 = Utf8 LHelloExample;
#21 = Utf8 getValue
#22 = Utf8 ()I
#23 = Utf8 setValue
#24 = Utf8 (I)V
#25 = Utf8 MethodParameters
#26 = Utf8 main
#27 = Utf8 ([Ljava/lang/String;)V
#28 = Utf8 args
#29 = Utf8 [Ljava/lang/String;
#30 = Utf8 SourceFile
#31 = Utf8 HelloExample.java
#32 = NameAndType #14:#15 // "<init>":()V
#33 = NameAndType #7:#8 // value:I
#34 = Utf8 abc
#35 = NameAndType #9:#10 // s:Ljava/lang/String;
#36 = Utf8 HelloExample
#37 = Utf8 java/lang/Object
字面量
字面量接近於java語言層面的常量概念,主要包括:
-
文字字串,也就是我們經常宣告的:
public String s = "abc";
中的"abc"
#3 = String #34 // abc
-
用final修飾的成員變數,包括靜態變數、例項變數和區域性變數
#11 = Utf8 f #12 = Utf8 ConstantValue #13 = Integer 257
這裡需要說明的一點,上面說的存在於常量池的字面量,指的是資料的值,也就是abc
和0x101(257)
,通過上面對常量池的觀察可知這兩個字面量是確實存在於常量池的。
而對於基本型別資料(甚至是方法中的區域性變數),也就是上面的private int value = 1
;常量池中只保留了他的的欄位描述符I
和欄位的名稱value
,他們的字面量不會存在於常量池:
符號引用
符號引用主要設涉及編譯原理方面的概念,包括下面三類常量:
-
類和介面的全限定名,也就是
Ljava/lang/String;
這樣,將類名中原來的"."替換為"/"得到的,主要用於在執行時解析得到類的直接引用.#5 = Class #36 // HelloExample #6 = Class #37 // java/lang/Object
-
欄位的名稱和描述符,欄位也就是類或者介面中宣告的變數,包括類級別變數(static)和例項級的變數
#2 = Fieldref #5.#33 // HelloExample.value:I #7 = Utf8 value #8 = Utf8 I
執行時常量
執行時常量池是方法區的一部分,所以也是全域性共享的。我們知道,jvm在執行某個類的時候,必須經過載入、連線(驗證,準備,解析)、初始化,在第一步的載入階段,虛擬機器需要完成下面3件事情:
- 通過一個類的“全限定名”來獲取此類的二進位制位元組流
- 將這個位元組流所代表的靜態儲存結構轉化為方法區的執行時資料結構
- 在記憶體中生成一個類代表這類的java.lang.Class物件,作為方法區這個類的各種資料訪問的入口
這裡需要說明的一點是,類物件和普通的例項物件是不同的,類物件是在類載入的時候生成的,普通的例項物件一般是在呼叫new之後建立。
上面第二條,將class位元組流代表的靜態儲存結構轉化為方法區的執行時資料結構,其中就包含了class檔案常量池進入執行時常量池的過程。這裡需要強調一下,不同的類共用一個執行時常量池,同時在進入執行時常量池的過程中,多個class檔案中常量池中相同的字串只會存在一份在執行時常量池中,這也是一種優化。
執行時常量池的作用是儲存 Java class檔案常量池中的符號資訊。執行時常量池 中儲存著一些 class 檔案中描述的符號引用,同時在類載入的“解析階段”還會將這些符號引用所翻譯出來的直接引用(直接指向例項物件的指標)儲存在 執行時常量池 中。
執行時常量池相對於 class 常量池一大特徵就是其具有動態性,Java 規範並不要求常量只能在執行時才產生,也就是說執行時常量池中的內容並不全部來自 class 常量池,class 常量池並非執行時常量池的唯一資料輸入口;在執行時可以通過程式碼生成常量並將其放入執行時常量池中,這種特性被用的較多的是String.intern()(這個方法下面將會詳細講)。
問題解答
理解了上述JVM的背景知識之後,再回到最開始的問題.下面這段程式碼會建立幾個物件?
String str=new String("abc");
- 首先,我們看到這個程式碼中有一個
new
關鍵字,我們知道new指令是建立一個類的例項物件並完成載入初始化的,因此這個字串物件是在執行期才能確定的,建立的字串物件是在堆記憶體上。 - 其次,在String的構造方法中傳遞了一個字串
abc
,由於這裡的abc
是被final
修飾的屬性,所以它是一個字串常量。在首次構建這個物件時,JVM拿字面量"abc"
去字串常量池試圖獲取其對應String物件的引用。於是在堆中建立了一個"abc"
的String物件,並將其引用儲存到字串常量池中,然後返回;
所以,這裡正確的回答應該是: 如果abc
這個字串常量不存在,則建立兩個物件,分別是abc
這個字串常量,以及new String
這個例項物件。
如果abc
這字串常量存在,則只會建立一個物件。
問題總結
關於這道題,其實涉及到的知識點非常多,我並沒有非常完整的把JVM的內容整體說完,因為JVM整個體系還是較為龐大的。
所以,建議大家平時如果有時間的情況下,可以系統化的學習一下JVM有關的內容,這塊的面試問題還是比較多的。
關注[跟著Mic學架構]公眾號,獲取更多精品原創