Java容器ArrayList原始碼淺析

zhuhean發表於2018-01-10

在Java給我們提供的各種容器類中，最常用的就是ArrayList了吧，你可能早就把它用爛了，但它內部細節是怎麼實現的，陣列怎麼動態增長的呢？今天我們就來看一下ArrayList的原始碼一探個究竟。

本文分析的ArrayList原始碼基於JDK 1.8

1. ArrayList 的定義

首先開啟ArrayList類，看一下這個類的定義：

public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable
複製程式碼

ArrayList繼承自AbstractList，支援泛型。

然後實現了這些介面：

List 說明該類是一個有序的序列集合。
RandomAccess 說明該類支援時間複雜度為O(1)隨機訪問；RandomAccess介面一般只用在實現了List介面的類。
Cloneable 說明該類支援被克隆。
Serializable 說明該類支援序列化。

ArrayList還間接實現了Iterable和Collection介面。

2. ArrayList 的屬性

ArrayList 中宣告瞭下面這些屬性：

    public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
    // 序列化ID
    private static final long serialVersionUID = 8683452581122892189L;

    // ArrayList的預設初始容量
    private static final int DEFAULT_CAPACITY = 10;

    // 一個空的物件陣列，用來初始化內容為空的ArrayList例項
    private static final Object[] EMPTY_ELEMENTDATA = {};

    // 資料物件陣列，真正的資料都儲存在這個陣列之中，標了transient關鍵字說明該物件陣列不參與序列化
    transient Object[] elementData; 

    // 當前ArrayList中包含的元素的個數
    private int size;
    
    // 當前ArrayList被修改過的次數
    protected transient int modCount = 0;
    // ...
    
}
複製程式碼

3. ArrayList 的建構函式

ArrayList分別提供了下面三個建構函式，首先來看下我們最常使用的無參建構函式：

    public ArrayList() {
        super();
        this.elementData = EMPTY_ELEMENTDATA;
    }
複製程式碼

很簡單，呼叫了下父類的建構函式（點進去發現父類建構函式是個空實現），然後將之前宣告的空物件陣列EMPTY_ELEMENTDATA賦值給elementData屬性。

接著看下可以傳初始容量的建構函式：

    public ArrayList(int initialCapacity) {
        super();
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        this.elementData = new Object[initialCapacity];
    }
複製程式碼

也是先呼叫父類建構函式，然後判斷如果傳進來的初始化容量initialCapacity小於0則丟擲異常，否則建立一個大小為initialCapacity的物件陣列並賦值給elementData。

最後還有個可以傳集合的建構函式：

    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        size = elementData.length;
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    }
複製程式碼

該方法要求傳入實現了Collection介面的類的物件，然後呼叫Collection類中的toArray()方法即可將該集合物件中包含的全部元素轉換為物件陣列。接著再初始化size。

按道理來說這就應該初始化完畢了吧，可是為什麼後面又緊跟了一句：

    if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
複製程式碼

原來Collection類的toArray()返回的不一定是Object[]類，舉個例子：

    public static void main(String[] args) {
        Collection c = Arrays.asList("a", "b", "c");
        System.out.println(c.toArray().getClass());
        List<Object> list = new ArrayList<>(c);
        list.set(0,new Object());
    }
複製程式碼

執行會發現，列印輸出的是class [Ljava.lang.String;，因此此時ArrayList內部的elementData即為String型別了，這時候呼叫最後一句list.set(0,new Object())則會丟擲ArrayStoreException異常，因為你不能往一個String陣列設定物件。

4. ArrayList 新增資料

4.1 add(E e)

先看下最常用的add(E e)方法：

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);
        elementData[size++] = e;
        return true;
    }
複製程式碼

該方法先呼叫了ensureCapacityInternal()方法，從方法名可以猜測，這個方法應該就是用來對陣列進行動態擴容的，跳轉到該方法：

    private void ensureCapacityInternal(int minCapacity) {
        if (elementData == EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        ensureExplicitCapacity(minCapacity);
    }
複製程式碼

該方法的引數minCapacity表示當前要求的最小容量，我們前面傳過來的是size + 1，即最小容量只要比當前元素數量多1就夠了。

如果elementData == EMPTY_ELEMENTDATA，則說明該ArrayList是通過無參建構函式構造的，這時候我們的minCapacity取預設容量(10)的和傳進來最小容量中較大的那一個。

接著又將minCapacity傳給ensureExplicitCapacity()方法：

    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;
        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }
複製程式碼

先自增了一下modCount，然後接著的程式碼就好玩了，為什麼不直接

    if (minCapacity > elementData.length){
        grow(minCapacity);
    }
複製程式碼

而要做個減法跟0比較呢？然後他這兒還有個註釋，說overflow-conscious code又是怎麼回事呢？

好接著點進grow()方法：

    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
複製程式碼

看到這裡，我不禁產生了關掉IDE的衝動。

好的，分情況討論一下。

先假設傳進來的minCapacity = 11，物件陣列elementData目前大小是10，即oldCapacity = 10，newCapacity在oldCapacity的基礎上增加一半，即newCapacity = 15；newCapacity - minCapacity = 4 > 0，第一個條件不通過；newCapacity - MAX_ARRAY_SIZE顯然小於0，第二個條件也不通過，所以到下一步newCapacity還是等於15，然後呼叫Arrays.copyOf(elementData, newCapacity)建立了一個長度為15的陣列副本，將原陣列中的資料拷貝到這個陣列副本中，最後將陣列副本賦值給elementData。看一下Arrays.copyOf()方法的原始碼就知道了：

    public static <T> T[] copyOf(T[] original, int newLength) {
        return (T[]) copyOf(original, newLength, original.getClass());
    }
    
    public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
        @SuppressWarnings("unchecked")
        T[] copy = ((Object)newType == (Object)Object[].class)
            ? (T[]) new Object[newLength]
            : (T[]) Array.newInstance(newType.getComponentType(), newLength);
        System.arraycopy(original, 0, copy, 0,
                         Math.min(original.length, newLength));
        return copy;
    }
    
複製程式碼

現在我們假設minCapacity = 16，物件陣列elementData的大小還是10，那麼跟剛剛唯一的區別就是newCapacity - minCapacity = -1 < 0，第一個條件通過，即newCapacity = 16，剩下還是一樣。
接下來就好玩了，如果當前elementData的大小已經超級大了，我是說超級超級大，大到了接近Integer.MAX_VALUE。

我們現在假設elementData的大小為Integer.MAX_VALUE - 100(即2147483547)，則minCapacity = Integer.MAX_VALUE - 99(即2147483548)，那麼此時再計算newCapacity則會溢位，此時newCapacity = -1073741976，變成了負數；此時newCapacity - minCapacity = 1073741772 > 0，不滿足第一個條件；newCapacity - MAX_ARRAY_SIZE = 1073741681 > 0, 通過第二個條件，呼叫hugeCapacity方法：

    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }
複製程式碼

hugeCapacity方法先判斷minCapacity是不是溢位了，如果溢位了就丟擲OutOfMemoryError，接著如果minCapacity沒有溢位但是比MAX_ARRAY_SIZE大，則返回Integer.MAX_VALUE，否則就返回MAX_ARRAY_SIZE。在我們舉例的這個情況下，hugeCapacity方法返回MAX_ARRAY_SIZE，因此最終的newCapacity就等於MAX_ARRAY_SIZE。

接下來考慮一下，如果我們把grow方法改寫成下面這樣會發生什麼：

    private void grow(int minCapacity) {
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity < minCapacity)
            newCapacity = minCapacity;
        if (newCapacity > MAX_ARRAY_SIZE)
            newCapacity = hugeCapacity(minCapacity);
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
複製程式碼

還是套用我們剛才的資料，oldCapacity = Integer.MAX_VALUE - 100(2147483547)，minCapacity = Integer.MAX_VALUE - 99(即2147483548)，newCapacity = -1073741976。會發現，修改過得程式碼跟原始碼的運作剛好相反，第一個條件通過，第二個條件則不通過，即不會呼叫hugeCapacity方法。這樣的話ArrayList就無法正確地擴容。

到這裡擴容部分的程式碼就結束了，回來看一下我們開始的add方法：

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);
        elementData[size++] = e;
        return true;
    }
複製程式碼

正確擴容後，直接將元素e賦值給物件陣列elementData下標為size的位置，因為此時size就是新增的元素應該在的下標，然後將size自增。

4.2 add(int index, E element)

接下來看下add(int index, E element)方法，在特定的下標index處插入元素：

    public void add(int index, E element) {
        rangeCheckForAdd(index);
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        System.arraycopy(elementData, index, elementData, index + 1,size - index);
        elementData[index] = element;
        size++;
    }
    
    private void rangeCheckForAdd(int index) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }
    
複製程式碼

首先呼叫了rangeCheckForAdd方法檢查下標index是否合法，不合法丟擲異常IndexOutOfBoundsException。

然後是呼叫ensureCapacityInternal方法進行擴容，確保ArrayList容量夠存放size + 1個元素。

接下來的System.arraycopy(elementData, index, elementData, index + 1,size - index)做的是將從index開始的元素全部都往後移動一位，如果原來的元素是[1,2,4,5]，index = 2，element = 3，經過這步會變成[1,2,4,4,5]。

接著就把元素element覆蓋到陣列中index的位置。即變成了[1,2,3,4,5]。

最後將size自增。

該方法最壞的情況是index = 0，因為這樣的話當前ArrayList中全部的元素都得往後移動一位。

4.3 addAll(Collection<? extends E> c)

我們剛看完了新增單個元素，現在來看下如何新增多個元素，ArrayList提供了addAll(Collection<? extends E> c)方法：

    public boolean addAll(Collection<? extends E> c) {
        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount
        System.arraycopy(a, 0, elementData, size, numNew);
        size += numNew;
        return numNew != 0;
    }
複製程式碼

該方法的引數也是Collection介面，呼叫Collection提供的toArray方法將Collection中的全部元素轉換為物件陣列a；接著獲取該陣列的大小並賦值給numNew，然後同樣是呼叫ensureCapacityInternal進行擴容。確保ArrayList容量可以存放size + numNew個元素後，直接將物件陣列a中的全部元素從末尾拷貝進elementData。最後正確增加size，如果numNew不為0返回true，否則返回false。

這裡我不理解的是，為什麼不先判斷集合是否為空，如果為空直接返回false就省去了後面的方法呼叫，有知道的朋友麻煩告訴我噢！

4.4 addAll(int index, Collection<? extends E> c)

ArrayList還提供了addAll(int index, Collection<? extends E> c)方法，可以從指定位置index開始插入多個元素：

public boolean addAll(int index, Collection<? extends E> c) {
        rangeCheckForAdd(index);
        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);
        int numMoved = size - index;
        if (numMoved > 0)
            System.arraycopy(elementData, index, elementData, index + numNew,numMoved);
        System.arraycopy(a, 0, elementData, index, numNew);
        size += numNew;
        return numNew != 0;
    }
複製程式碼

同樣先通過呼叫rangeCheckForAdd方法判斷index是否合法，index合法後接下來還是先調Collection的toArray方法轉換為物件陣列a，然後一樣呼叫ensureCapacityInternal方法。

跟前面的addAll方法不同的是，我們這裡可能要移動一些元素，因此通過size - index先計算要移動的元素個數，如果numMoved大於0則說明需要移動元素，即將index開始的元素統統往後numNew位；否則numMoved等於0，說明直接從末尾新增，無需移動元素。

接下來將物件陣列a中的全部元素從index開始拷貝到elementData中。最後正確增加size。如果numNew不等於0返回true。

5. ArrayList 訪問資料

訪問資料比較簡單，ArrayList提供了get()方法：

    public E get(int index) {
        rangeCheck(index);
        return elementData(index);
    }
    
    private void rangeCheck(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }
    
    E elementData(int index) {
        return (E) elementData[index];
    }
    
複製程式碼

首先呼叫rangeCheck(int index)方法檢查下標是否超出了範圍，然後通過呼叫封裝好的elementData(int index)方法獲取index對應的元素。

6. ArrayList 查詢資料

6.1 indexOf(Object o)

    public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }
複製程式碼

indexOf分兩種情況，如果查詢的物件為null，則通過for迴圈找到第一個為null的元素的位置並返回了；如果查詢的物件不為null，則通過呼叫equals()方法判斷是否同一個元素，找到即返回位置；如果沒找到返回-1。

6.2 lastIndexOf(Object o)

    public int lastIndexOf(Object o) {
        if (o == null) {
            for (int i = size-1; i >= 0; i--)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = size-1; i >= 0; i--)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }
複製程式碼

lastIndexOf()方法跟indexOf()方法唯一的區別就是它的for迴圈是從後往前的。

6.3 contains(Object o)

    public boolean contains(Object o) {
        return indexOf(o) >= 0;
    }
複製程式碼

contains方法是通過呼叫indexOf方法實現的，如果indexOf方法返回的數字大於等於零，說明物件o存在，否則返回-1。

7. ArrayList 刪除資料

7.1 remove(int index)

remove(int index)方法用來刪除指定下標的元素：

    public E remove(int index) {
        rangeCheck(index);
        modCount++;
        E oldValue = elementData(index);
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,numMoved);
        elementData[--size] = null; // clear to let GC do its work
        return oldValue;
    }
複製程式碼

remove方法的操作是，把index後面的元素都往前移一位，然後刪除最後一個元素。

7.2 remove(Object o)

remove(Object o) 可以用來刪除某指定元素

    public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }
複製程式碼

該方法跟indexOf(Object o)非常相似。remove(Object o)方法找到元素所在位置後，呼叫fastRemove(int index)方法刪除元素：

    private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }
複製程式碼

fastRemove(int index)跟remove(int index)方法的區別是，它不檢查index，也不返回刪除的元素。

8. ArrayList 修改資料

ArrayList提供了set(int index, E element)方法來更新某位置的值，也比較簡單：

    public E set(int index, E element) {
        rangeCheck(index);
        E oldValue = elementData(index);
        elementData[index] = element;
        return oldValue;
    }
複製程式碼

先呼叫rangeCheck()方法保證index合法，接下來呼叫elementData()方法獲取index位置的元素並儲存在區域性變數oldValue中，然後將該位置的元素更新為element，最後返回oldValue。

9. 其他

9.1 trimToSize()

trimToSize()方法可以用來將物件陣列的大小壓縮到跟size一樣大：

    public void trimToSize() {
        modCount++;
        if (size < elementData.length) {
            elementData = Arrays.copyOf(elementData, size);
        }
    }
複製程式碼

9.2 size()

size()方法返回當前包含的元素大小

    public int size() {
        return size;
    }
複製程式碼

9.3 isEmpty()

判斷當前ArrayList內的元素是否為空

    public boolean isEmpty() {
        return size == 0;
    }
複製程式碼

9.4 toArray()

返回包含當前ArrayList全部元素的物件陣列

    public Object[] toArray() {
        return Arrays.copyOf(elementData, size);
    }
複製程式碼

9.5 clear()

清除當前ArrayList中全部元素

    public void clear() {
        modCount++;
        for (int i = 0; i < size; i++)
            elementData[i] = null;
        size = 0;
    }
複製程式碼

就把物件陣列中每個元素設為null，然後size重置為0。

9.6 sort(Comparator<? super E> c)

根據傳進來的Comparator對ArrayList中的元素進行排序：

    public void sort(Comparator<? super E> c) {
        final int expectedModCount = modCount;
        Arrays.sort((E[]) elementData, 0, size, c);
        if (modCount != expectedModCount) {
            throw new ConcurrentModificationException();
        }
        modCount++;
    }
複製程式碼

具體的排序通過呼叫Arrays中的靜態方法sort(T[] a, int fromIndex, int toIndex,Comparator<? super T> c)。

10. 參考

Java容器原始碼學習--ArrayList原始碼分析
2021-12-26
Java原始碼
Java原始碼篇之容器類——ArrayList
2020-05-09
Java原始碼
Java容器類框架分析(1)ArrayList原始碼分析
2019-01-28
Java框架原始碼
Java7 ConcurrentHashMap原始碼淺析
2019-03-02
JavaHashMap原始碼
Java集合之ConcurrentHashMap原始碼淺析
2017-11-25
JavaHashMap原始碼
ArrayList底層原理淺析
2020-12-05
Redux原始碼淺析
2019-02-11
Redux原始碼
redux 原始碼淺析
2021-05-31
Redux原始碼
Koa 原始碼淺析
2018-09-16
原始碼
webmagic原始碼淺析
2020-10-23
Web原始碼
淺析Redux原始碼
2018-05-14
Redux原始碼
ARouter原始碼淺析
2017-12-01
原始碼
Java——ArrayList原始碼解析
2018-12-11
Java原始碼
搞懂 Java ArrayList 原始碼
2018-03-23
Java原始碼
容器中Java 程式OOMKilled原因淺析
2019-06-16
JavaOOM
Flutter 原始碼系列：DropdownButton 原始碼淺析
2019-07-03
Flutter原始碼
Java集合原始碼剖析——ArrayList原始碼剖析
2018-06-30
Java原始碼
【Java集合原始碼剖析】ArrayList原始碼剖析
2014-06-30
Java原始碼
Discuz! Q 原始碼淺析
2020-07-21
原始碼
Lifecycle原始碼淺析
2019-05-06
原始碼
quicklink原始碼淺析
2018-12-19
UI原始碼
RecyclerView動畫原始碼淺析
2018-12-19
View動畫原始碼
String原始碼淺析
2020-09-11
原始碼
Guava原始碼淺析——Joiner
2018-03-08
Guava原始碼
LinkedList原始碼淺析
2017-01-12
原始碼
ThreadLocal 原始碼淺析
2024-06-24
thread原始碼
【Java集合】ArrayList原始碼分析
2021-07-12
Java原始碼
JAVA集合：ArrayList原始碼分析
2018-03-30
Java原始碼
react原始碼淺析(三)：ReactElement
2019-02-28
React原始碼
react原始碼淺析(三)：ReactChildren
2019-03-01
React原始碼
RXSwift原始碼淺析(二)
2019-03-04
Swift原始碼
String 原始碼淺析(一)
2019-01-19
原始碼
【QT】QThread原始碼淺析
2020-11-07
QTthread原始碼
react-window 原始碼淺析
2022-03-01
React原始碼
react-router 原始碼淺析
2018-06-09
React原始碼
【Android原始碼】PackageManagerService 淺析
2017-12-23
Android原始碼Package
【Android原始碼】WindowManagerService 淺析
2017-12-23
Android原始碼
RXSwift原始碼淺析(一)
2017-12-17
Swift原始碼