jdk8:jvm虛擬機器記憶體模型

行者路上發表於2018-08-02

java記憶體模型,分為程式計數器,虛擬機器棧,本地方法棧,java堆,java棧。根據受訪的許可權不同設定,可以分為執行緒共享和執行緒私有。執行緒共享指可以允許所有的執行緒共享訪問的一類記憶體區域,包括堆記憶體區,方法區,執行的常量池。

這裡寫圖片描述

程式計數器(Program Counter Register)

在虛擬機器的概念模型裡(僅是概念模型,各種虛擬機器可能會通過一些更高效的方式去實現),位元組碼直譯器工作時就是通過改變這個計數器的值來選取下一條需要執行的位元組碼指令,分支、迴圈、跳轉、異常處理、執行緒恢復等基礎功能都需要依賴這個計數器來完成。
由於Java 虛擬機器的多執行緒是通過執行緒輪流切換並分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對於多核處理器來說是一個核心)只會執行一條執行緒中的指令。因此,為了執行緒切換後能恢復到正確的執行位置,每條執行緒都需要有一個獨立的程式計數器,各條執行緒之間的計數器互不影響,獨立儲存,我們稱這類記憶體區域為“執行緒私有”的記憶體。
如果執行緒正在執行的是一個Java 方法,這個計數器記錄的是正在執行的虛擬機器位元組碼指令的地址;如果正在執行的是Natvie 方法,這個計數器值則為空(Undefined)。
此記憶體區域是唯一一個在Java 虛擬機器規範中沒有規定任何OutOfMemoryError 情況的區域。

java虛擬機器棧(Java Virtual Machine Stacks)

定義:

與程式計數器一樣,Java 虛擬機器棧(Java Virtual Machine Stacks)也是執行緒私有的,它的生命週期與執行緒相同。虛擬機器棧描述的是Java 方法執行的記憶體模型:每個方法被執行的時候都會同時建立一個棧幀(Stack Frame )用於儲存區域性變數表、操作棧、動態連結、方法出口等資訊。每一個方法被呼叫直至執行完成的過程,就對應著一個棧幀在虛擬機器棧中從入棧到出棧的過程。

組成

棧幀由三部分組成:區域性變數區,運算元,幀資料區

  1. 區域性變數表存放了編譯期可知的各種基本資料型別(boolean、byte、char、short、int、float、long、double)、物件引用(reference
    型別,它不等同於物件本身,根據不同的虛擬機器實現,它可能是一個指向物件起始地址的引用指標,也可能指向一個代表物件的控制程式碼或者其他與此物件相關的位置)和returnAddress 型別(指向了一條位元組碼指令的地址)。區域性變數區被定義一個從0開始的數字陣列,byte、Char、short,boolean轉換成int,long double2個位元組。其中64 位長度的long 和double 型別的資料會佔用2 個區域性變數空間(Slot),其餘的資料型別只佔用1個。區域性變數通過陣列的下標訪問。
  2. 運算元棧也被定義為一個數字陣列,,不同於區域性變數區的通過下標訪問,而是通過棧的push和pop操作。
  3. 幀資料區主要作用為
    • 解析常量池的資料
    • 方法執行完後處理方法返回,恢復呼叫方現場
    • 方法執行過程中丟擲異常時異常的處理,當出現異常時虛擬機器查詢相應的異常表看是否有對應的catch語句,如果沒有就丟擲異常終止這個方法呼叫。

StackOverflowError和OutOfMemoryError

在Java 虛擬機器規範中,對這個區域規定了兩種異常狀況:如果執行緒請求的棧深度大於虛擬機器所允許的深度,將丟擲StackOverflowError 異常;如果虛擬機器棧可以動態擴充套件(當前大部分的Java 虛擬機器都可動態擴充套件,只不過Java 虛擬機器規範中也允許固定長度的虛擬機器棧),當擴充套件時無法申請到足夠的記憶體時會丟擲OutOfMemoryError 異常。
StackOverflowError:可以通過-Xss選項來設定虛擬機器棧的大小,棧的大小直接決定了函式呼叫的最大可達深度。

public class TestJvmStack {

    static int count = 0;
    public static void main(String[] args) {

        try {
            test1();
        } catch (Throwable e) {
            System.out.println("stack length is " + count);
            e.printStackTrace();
        }
    }

    private static void test1() {
        count ++;
        test1();
    }
}

設定棧的深度為:-Xss1m

報錯資訊為:
這裡寫圖片描述

函式的呼叫次數由棧的大小決定。一般來說,棧越大,函式巢狀呼叫次數越多。一個函式而言,它的引數越多,內部區域性變數越多,它的棧幀越大,其巢狀的呼叫次數就會減少。

本地方法棧(native method stack)

本地方法棧(Native Method Stacks)與虛擬機器棧所發揮的作用是非常相似的,其區別不過是虛擬機器棧為虛擬機器執行Java 方法(也就是位元組碼)服務,而本地方法棧則是為虛擬機器使用到的Native 方法服務。虛擬機器規範中對本地方法棧中的方法使用的語言、使用方式與資料結構並沒有強制規定,因此具體的虛擬機器可以自由實現它。甚至有的虛擬機器(譬如Sun HotSpot 虛擬機器)直接就把本地方法棧和虛擬機器棧合二為一。
與虛擬機器棧一樣,本地方法棧區域也會丟擲StackOverflowError 和OutOfMemoryError異常。

java堆

Java 堆(Java Heap)是Java 虛擬機器所管理的記憶體中最大的一塊。Java 堆是被所有執行緒共享的一塊記憶體區域,在虛擬機器啟動時建立。此記憶體區域的唯一目的就是存放物件例項,幾乎所有的物件例項都在這裡分配記憶體。這一點在Java 虛擬機器規範中的描述是:所有的物件例項以及陣列都要在堆上分配①,但是隨著JIT 編譯器的發展與逃逸分析技術的逐漸成熟,棧上分配、標量替換②優化技術將會導致一些微妙的變化發生,所有的物件都分配在堆上也漸漸變得不是那麼“絕對”了。
Java 堆是垃圾收集器管理的主要區域,因此很多時候也被稱做“GC 堆”(Garbage Collected Heap)。如果從記憶體回收的角度看,由於現在
收集器基本都是採用的分代收集演算法,所以Java 堆中還可以細分為:新生代和老年代;再細緻一點的有Eden 空間、From Survivor 空間、To Survivor 空間等。如果從記憶體分配的角度看,執行緒共享的Java 堆中可能劃分出多個執行緒私有的分配緩衝區(Thread LocalAllocation Buffer,TLAB)。不過,無論如何劃分,都與存放內容無關,無論哪個區域,儲存的都仍然是物件例項,進一步劃分的目的是為了更好地回收記憶體,或者更快地分配記憶體。
根據Java 虛擬機器規範的規定,Java 堆可以處於物理上不連續的記憶體空間中,只要邏輯上是連續的即可,就像我們的磁碟空間一樣。在實現時,既可以實現成固定大小的,也可以是可擴充套件的,不過當前主流的虛擬機器都是按照可擴充套件來實現的(通過-Xmx和-Xms 控制)。如果在堆中沒有記憶體完成例項分配,並且堆也無法再擴充套件時,將會丟擲OutOfMemoryError 異常。

heap的OutOfMemoryError

import java.util.ArrayList;
import java.util.List;

public class JavaHeapOutOfMemoryError {

    public static void main(String[] args) {

        List<String> list = new ArrayList<>();

        while (true) {
            list.add("此外,小南斯還告誡前湖人隊友們,成為詹姆斯隊友後,他們時刻會被置於放大鏡下,這種壓力他們必須能夠應對。");
        }
    }
}

設定引數-Xmx100m -Xms100m

這裡寫圖片描述

方法區(Method Area)

方法區主要儲存的資訊是類的後設資料。是各個執行緒共享的記憶體區域,它用於儲存已被虛擬機器載入的型別的資訊,常量池,域資訊,方法資訊。
- 型別資訊包含類的完整名字,父類的完整名字,型別修飾符(private,protected,public)和型別的直接介面類表
- 常量池包含類方法,域等資訊的常量資訊
- 域資訊包含域的名稱,域的型別以及域的修飾符
- 方法資訊包含方法名稱,返回型別,方法引數,方法修飾符,方法位元組碼,運算元和方法棧幀的區域性變數區的大小以及異常表

方法區溢位

package com.own.learn.jvm;


import net.sf.cglib.proxy.Enhancer;
import net.sf.cglib.proxy.MethodInterceptor;
import net.sf.cglib.proxy.MethodProxy;

import java.lang.reflect.Method;

public class MethodAreaOutOfMemory {

    public static void main(String[] args) {

        while (true) {

            Enhancer enhancer = new Enhancer();
            enhancer.setSuperclass(TestCase.class);
            enhancer.setUseCache(false);
            enhancer.setCallback(new MethodInterceptor() {
                @Override
                public Object intercept(Object arg0, Method arg1, Object[] arg2,
                                        MethodProxy arg3) throws Throwable {
                    return arg3.invokeSuper(arg0, arg2);
                }
            });

            enhancer.create();
        }
    }

    static class TestCase {

    }
}

vm options:-XX:MaxMetaspaceSize=5m

這裡寫圖片描述

GC

  • JDK8開始,持久代已經被徹底刪除了,取代它的是另一個記憶體區域也被稱為元空間。
  • 方法區也可被垃圾收集,當某個類不在被使用(不可觸及)時,JVM將解除安裝這個類,進行垃圾收集
  • 方法區是執行緒安全的。由於所有的執行緒都共享方法區,所以,方法區裡的資料訪問必須被設計成執行緒安全的。例如,假如同時有兩個執行緒都企圖訪問方法區中的同一個類,而這個類還沒有被裝入JVM,那麼只允許一個執行緒去裝載它,而其它執行緒必須等待。
  • 方法區的大小不必是固定的,JVM可根據應用需要動態調整。同時,方法區也不一定是連續的,方法區可以在一個堆(甚至是JVM自己的堆)中自由分配。

    執行時常量池

    執行時常量池(Runtime Constant Pool)是方法區的一部分。Class 檔案中除了有類的版本、欄位、方法、介面等描述等資訊外,還有一項資訊是常量池(Constant PoolTable),用於存放編譯期生成的各種字面量和符號引用,這部分內容將在類載入後存放到方法區的執行時常量池中。
    Java 虛擬機器對Class 檔案的每一部分(自然也包括常量池)的格式都有嚴格的規定,每一個位元組用於儲存哪種資料都必須符合規範上的要求,這樣才會被虛擬機器認可、裝載和執行。但對於執行時常量池,Java 虛擬機器規範沒有做任何細節的要求,不同的提供商實現的虛擬機器可以按照自己的需要來實現這個記憶體區域。不過,一般來說,除了儲存Class 檔案中描述的符號引用外,還會把翻譯出來的直接引用也儲存在執行時常量池中。
    執行時常量池相對於Class 檔案常量池的另外一個重要特徵是具備動態性,Java 語言並不要求常量一定只能在編譯期產生,也就是並非預置入Class 檔案中常量池的內容才能進入方法區執行時常量池,執行期間也可能將新的常量放入池中,這種特性被開發人員利用得比較多的便是String 類的intern() 方法。
    既然執行時常量池是方法區的一部分,自然會受到方法區記憶體的限制,當常量池無法再申請到記憶體時會丟擲OutOfMemoryError 異常
    jdk8中常量池放在堆中

常量池的OutOfMemoryError

import java.util.ArrayList;
import java.util.List;

public class ConstantPoolOutOfMemory {


    public static void main(String[] args) {

        List<String> list = new ArrayList<>();

        int i =1;
        while (true) {
            list.add(String.valueOf(i).intern());
            i++;
        }
    }
}

VM options:-Xmx10m -Xms10m
這裡寫圖片描述

直接記憶體(Direct Memory)

直接記憶體(Direct Memory)並不是虛擬機器執行時資料區的一部分,也不是Java虛擬機器規範中定義的記憶體區域,但是這部分記憶體也被頻繁地使用,而且也可能導致OutOfMemoryError 異常出現,所以我們放到這裡一起講解。
在JDK 1.4 中新加入了NIO(New Input/Output)類,引入了一種基於通道(Channel)與緩衝區(Buffer)的I/O 方式,它可以使用Native 函式庫直接分配堆外記憶體,然後通過一個儲存在Java 堆裡面的DirectByteBuffer 物件作為這塊記憶體的引用進行操作。這樣能在一些場景中顯著提高效能,因為避免了在Java 堆和Native 堆中來回複製資料。
顯然,本機直接記憶體的分配不會受到Java 堆大小的限制,但是,既然是記憶體,則肯定還是會受到本機總記憶體(包括RAM 及SWAP 區或者分頁檔案)的大小及處理器定址空間的限制。伺服器管理員配置虛擬機器引數時,一般會根據實際記憶體設定-Xmx等引數資訊,但經常會忽略掉直接記憶體,使得各個記憶體區域的總和大於實體記憶體限制(包括物理上的和作業系統級的限制),從而導致動態擴充套件時出現OutOfMemoryError
異常。

直接記憶體的OutOfMemoryError

import sun.misc.Unsafe;

import java.lang.reflect.Field;

public class DirectoryMemoryOutOfMemory {


    static int ONE_MB = 1024 * 1024;
    static int index = 0 ;
    public static void main(String[] args) {

        try {

            Field field = Unsafe.class.getDeclaredField("theUnsafe");
            field.setAccessible(true);
            Unsafe unsafe = (Unsafe)field.get(null);

            while (true) {
                index ++;
                unsafe.allocateMemory(ONE_MB);
            }
        } catch (Exception e) {
            System.out.println("index  : " + index);
            e.printStackTrace();
        } catch (Error e) {
            System.out.println("index  : " + index);
            e.printStackTrace();
        }
    }

}

vm options:-Xmx20M -XX:MaxDirectMemorySize=10M
這裡寫圖片描述

虛擬機器物件的訪問

在Java 語言中,物件訪問是如何進行的?物件訪問在Java 語言中無處不在,是最普通的程式行為,但即使是最簡單的訪問,也會卻涉及Java 棧、Java 堆、方法區這三個最重要記憶體區域之間的關聯關係,如下面的這句程式碼:
Object obj = new Object();
假設這句程式碼出現在方法體中,那“Object obj”這部分的語義將會反映到Java 棧的本地變數表中,作為一個reference 型別資料出現。而“new Object()”這部分的語義將會反映到Java 堆中,形成一塊儲存了Object 型別所有例項資料值(Instance Data,物件中各個例項欄位的資料)的結構化記憶體,根據具體型別以及虛擬機器實現的物件記憶體佈局(Object Memory Layout)的不同,這塊記憶體的長度是不固定的。另外,在Java 堆中還必須包含能查詢到此物件型別資料(如物件型別、父類、實現的介面、方法等)的地址資訊,這些型別資料則儲存在方法區中。

由於reference 型別在Java 虛擬機器規範裡面只規定了一個指向物件的引用,並沒有定義這個引用應該通過哪種方式去定位,以及訪問到Java 堆中的物件的具體位置,因此不同虛擬機器實現的物件訪問方式會有所不同,主流的訪問方式有兩種:使用控制程式碼和直接指標

控制程式碼

如果使用控制程式碼訪問方式,Java 堆中將會劃分出一塊記憶體來作為控制程式碼池,reference中儲存的就是物件的控制程式碼地址,而控制程式碼中包含了物件例項資料和型別資料各自的具體地址資訊,如下圖所示。
這裡寫圖片描述

直接指標

如果使用直接指標訪問方式,Java 堆物件的佈局中就必須考慮如何放置訪問型別資料的相關資訊,reference 中直接儲存的就是物件地址,如下圖所示
這裡寫圖片描述

比較

這兩種物件的訪問方式各有優勢,使用控制程式碼訪問方式的最大好處就是reference 中儲存的是穩定的控制程式碼地址,在物件被移動(垃圾收集時移動物件是非常普遍的行為)時只會改變控制程式碼中的例項資料指標,而reference 本身不需要被修改。
使用直接指標訪問方式的最大好處就是速度更快,它節省了一次指標定位的時間開銷,由於物件的訪問在Java 中非常頻繁,因此這類開銷積少成多後也是一項非常可觀的執行成本。就本書討論的主要虛擬機器Sun HotSpot 而言,它是使用第二種方式進行物件訪問的,但從整個軟體開發的範圍來看,各種語言和框架使用控制程式碼來訪問的情況也十分常見。

相關文章