Java容器ArrayList原始碼淺析

zhuhean發表於2018-01-10

在Java給我們提供的各種容器類中,最常用的就是ArrayList了吧,你可能早就把它用爛了,但它內部細節是怎麼實現的,陣列怎麼動態增長的呢?今天我們就來看一下ArrayList的原始碼一探個究竟。

本文分析的ArrayList原始碼基於JDK 1.8

1. ArrayList 的定義

首先開啟ArrayList類,看一下這個類的定義:

public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable
複製程式碼

ArrayList繼承自AbstractList,支援泛型。

然後實現了這些介面:

  • List 說明該類是一個有序的序列集合。
  • RandomAccess 說明該類支援時間複雜度為O(1)隨機訪問;RandomAccess介面一般只用在實現了List介面的類。
  • Cloneable 說明該類支援被克隆。
  • Serializable 說明該類支援序列化。

ArrayList還間接實現了Iterable和Collection介面。

2. ArrayList 的屬性

ArrayList 中宣告瞭下面這些屬性:

    public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
    // 序列化ID
    private static final long serialVersionUID = 8683452581122892189L;

    // ArrayList的預設初始容量
    private static final int DEFAULT_CAPACITY = 10;

    // 一個空的物件陣列,用來初始化內容為空的ArrayList例項
    private static final Object[] EMPTY_ELEMENTDATA = {};

    // 資料物件陣列,真正的資料都儲存在這個陣列之中,標了transient關鍵字說明該物件陣列不參與序列化
    transient Object[] elementData; 

    // 當前ArrayList中包含的元素的個數
    private int size;
    
    // 當前ArrayList被修改過的次數
    protected transient int modCount = 0;
    // ...
    
}
複製程式碼

3. ArrayList 的建構函式

ArrayList分別提供了下面三個建構函式,首先來看下我們最常使用的無參建構函式:

    public ArrayList() {
        super();
        this.elementData = EMPTY_ELEMENTDATA;
    }
複製程式碼

很簡單,呼叫了下父類的建構函式(點進去發現父類建構函式是個空實現),然後將之前宣告的空物件陣列EMPTY_ELEMENTDATA賦值給elementData屬性。

接著看下可以傳初始容量的建構函式:

    public ArrayList(int initialCapacity) {
        super();
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        this.elementData = new Object[initialCapacity];
    }
複製程式碼

也是先呼叫父類建構函式,然後判斷如果傳進來的初始化容量initialCapacity小於0則丟擲異常,否則建立一個大小為initialCapacity的物件陣列並賦值給elementData。

最後還有個可以傳集合的建構函式:

    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        size = elementData.length;
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    }
複製程式碼

該方法要求傳入實現了Collection介面的類的物件,然後呼叫Collection類中的toArray()方法即可將該集合物件中包含的全部元素轉換為物件陣列。 接著再初始化size。

按道理來說這就應該初始化完畢了吧,可是為什麼後面又緊跟了一句:

    if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
複製程式碼

Java容器ArrayList原始碼淺析

原來Collection類的toArray()返回的不一定是Object[]類,舉個例子:

    public static void main(String[] args) {
        Collection c = Arrays.asList("a", "b", "c");
        System.out.println(c.toArray().getClass());
        List<Object> list = new ArrayList<>(c);
        list.set(0,new Object());
    }
複製程式碼

執行會發現,列印輸出的是class [Ljava.lang.String;,因此此時ArrayList內部的elementData即為String型別了,這時候呼叫最後一句list.set(0,new Object())則會丟擲ArrayStoreException異常,因為你不能往一個String陣列設定物件。

4. ArrayList 新增資料

4.1 add(E e)

先看下最常用的add(E e)方法:

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);
        elementData[size++] = e;
        return true;
    }
複製程式碼

該方法先呼叫了ensureCapacityInternal()方法,從方法名可以猜測,這個方法應該就是用來對陣列進行動態擴容的,跳轉到該方法:

    private void ensureCapacityInternal(int minCapacity) {
        if (elementData == EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        ensureExplicitCapacity(minCapacity);
    }
複製程式碼

該方法的引數minCapacity表示當前要求的最小容量,我們前面傳過來的是size + 1,即最小容量只要比當前元素數量多1就夠了。

如果elementData == EMPTY_ELEMENTDATA,則說明該ArrayList是通過無參建構函式構造的,這時候我們的minCapacity取預設容量(10)的和傳進來最小容量中較大的那一個。

接著又將minCapacity傳給ensureExplicitCapacity()方法:

    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;
        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }
複製程式碼

先自增了一下modCount,然後接著的程式碼就好玩了,為什麼不直接

    if (minCapacity > elementData.length){
        grow(minCapacity);
    }
複製程式碼

而要做個減法跟0比較呢?然後他這兒還有個註釋,說overflow-conscious code又是怎麼回事呢?

Java容器ArrayList原始碼淺析

好接著點進grow()方法:

    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
複製程式碼

Java容器ArrayList原始碼淺析

看到這裡,我不禁產生了關掉IDE的衝動。

好的,分情況討論一下。

  • 先假設傳進來的minCapacity = 11,物件陣列elementData目前大小是10,即oldCapacity = 10,newCapacity在oldCapacity的基礎上增加一半,即newCapacity = 15;newCapacity - minCapacity = 4 > 0,第一個條件不通過;newCapacity - MAX_ARRAY_SIZE顯然小於0,第二個條件也不通過,所以到下一步newCapacity還是等於15,然後呼叫Arrays.copyOf(elementData, newCapacity)建立了一個長度為15的陣列副本,將原陣列中的資料拷貝到這個陣列副本中,最後將陣列副本賦值給elementData。看一下Arrays.copyOf()方法的原始碼就知道了:
    public static <T> T[] copyOf(T[] original, int newLength) {
        return (T[]) copyOf(original, newLength, original.getClass());
    }
    
    public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
        @SuppressWarnings("unchecked")
        T[] copy = ((Object)newType == (Object)Object[].class)
            ? (T[]) new Object[newLength]
            : (T[]) Array.newInstance(newType.getComponentType(), newLength);
        System.arraycopy(original, 0, copy, 0,
                         Math.min(original.length, newLength));
        return copy;
    }
    
複製程式碼
  • 現在我們假設minCapacity = 16,物件陣列elementData的大小還是10,那麼跟剛剛唯一的區別就是newCapacity - minCapacity = -1 < 0,第一個條件通過,即newCapacity = 16,剩下還是一樣。

  • 接下來就好玩了,如果當前elementData的大小已經超級大了,我是說超級超級大,大到了接近Integer.MAX_VALUE。

我們現在假設elementData的大小為Integer.MAX_VALUE - 100(即2147483547),則minCapacity = Integer.MAX_VALUE - 99(即2147483548),那麼此時再計算newCapacity則會溢位,此時newCapacity = -1073741976,變成了負數;此時newCapacity - minCapacity = 1073741772 > 0,不滿足第一個條件;newCapacity - MAX_ARRAY_SIZE = 1073741681 > 0, 通過第二個條件,呼叫hugeCapacity方法:

    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }
複製程式碼

hugeCapacity方法先判斷minCapacity是不是溢位了,如果溢位了就丟擲OutOfMemoryError,接著如果minCapacity沒有溢位但是比MAX_ARRAY_SIZE大,則返回Integer.MAX_VALUE,否則就返回MAX_ARRAY_SIZE。 在我們舉例的這個情況下,hugeCapacity方法返回MAX_ARRAY_SIZE,因此最終的newCapacity就等於MAX_ARRAY_SIZE。

接下來考慮一下,如果我們把grow方法改寫成下面這樣會發生什麼:

    private void grow(int minCapacity) {
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity < minCapacity)
            newCapacity = minCapacity;
        if (newCapacity > MAX_ARRAY_SIZE)
            newCapacity = hugeCapacity(minCapacity);
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
複製程式碼

還是套用我們剛才的資料,oldCapacity = Integer.MAX_VALUE - 100(2147483547),minCapacity = Integer.MAX_VALUE - 99(即2147483548),newCapacity = -1073741976。會發現,修改過得程式碼跟原始碼的運作剛好相反,第一個條件通過,第二個條件則不通過,即不會呼叫hugeCapacity方法。這樣的話ArrayList就無法正確地擴容。

到這裡擴容部分的程式碼就結束了,回來看一下我們開始的add方法:

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);
        elementData[size++] = e;
        return true;
    }
複製程式碼

正確擴容後,直接將元素e賦值給物件陣列elementData下標為size的位置,因為此時size就是新增的元素應該在的下標,然後將size自增。

4.2 add(int index, E element)

接下來看下add(int index, E element)方法,在特定的下標index處插入元素:

    public void add(int index, E element) {
        rangeCheckForAdd(index);
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        System.arraycopy(elementData, index, elementData, index + 1,size - index);
        elementData[index] = element;
        size++;
    }
    
    private void rangeCheckForAdd(int index) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }
    
複製程式碼

首先呼叫了rangeCheckForAdd方法檢查下標index是否合法,不合法丟擲異常IndexOutOfBoundsException。

然後是呼叫ensureCapacityInternal方法進行擴容,確保ArrayList容量夠存放size + 1個元素。

接下來的System.arraycopy(elementData, index, elementData, index + 1,size - index)做的是將從index開始的元素全部都往後移動一位,如果原來的元素是[1,2,4,5],index = 2,element = 3,經過這步會變成[1,2,4,4,5]。

接著就把元素element覆蓋到陣列中index的位置。即變成了[1,2,3,4,5]。

最後將size自增。

該方法最壞的情況是index = 0,因為這樣的話當前ArrayList中全部的元素都得往後移動一位。

4.3 addAll(Collection<? extends E> c)

我們剛看完了新增單個元素,現在來看下如何新增多個元素,ArrayList提供了addAll(Collection<? extends E> c)方法:

    public boolean addAll(Collection<? extends E> c) {
        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount
        System.arraycopy(a, 0, elementData, size, numNew);
        size += numNew;
        return numNew != 0;
    }
複製程式碼

該方法的引數也是Collection介面,呼叫Collection提供的toArray方法將Collection中的全部元素轉換為物件陣列a;接著獲取該陣列的大小並賦值給numNew,然後同樣是呼叫ensureCapacityInternal進行擴容。確保ArrayList容量可以存放size + numNew個元素後,直接將物件陣列a中的全部元素從末尾拷貝進elementData。最後正確增加size,如果numNew不為0返回true,否則返回false。

這裡我不理解的是,為什麼不先判斷集合是否為空,如果為空直接返回false就省去了後面的方法呼叫,有知道的朋友麻煩告訴我噢!

4.4 addAll(int index, Collection<? extends E> c)

ArrayList還提供了addAll(int index, Collection<? extends E> c)方法,可以從指定位置index開始插入多個元素:

public boolean addAll(int index, Collection<? extends E> c) {
        rangeCheckForAdd(index);
        Object[] a = c.toArray();
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);
        int numMoved = size - index;
        if (numMoved > 0)
            System.arraycopy(elementData, index, elementData, index + numNew,numMoved);
        System.arraycopy(a, 0, elementData, index, numNew);
        size += numNew;
        return numNew != 0;
    }
複製程式碼

同樣先通過呼叫rangeCheckForAdd方法判斷index是否合法,index合法後接下來還是先調Collection的toArray方法轉換為物件陣列a,然後一樣呼叫ensureCapacityInternal方法。

跟前面的addAll方法不同的是,我們這裡可能要移動一些元素,因此通過size - index先計算要移動的元素個數,如果numMoved大於0則說明需要移動元素,即將index開始的元素統統往後numNew位;否則numMoved等於0,說明直接從末尾新增,無需移動元素。

接下來將物件陣列a中的全部元素從index開始拷貝到elementData中。最後正確增加size。如果numNew不等於0返回true。

5. ArrayList 訪問資料

訪問資料比較簡單,ArrayList提供了get()方法:

    public E get(int index) {
        rangeCheck(index);
        return elementData(index);
    }
    
    private void rangeCheck(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }
    
    E elementData(int index) {
        return (E) elementData[index];
    }
    
複製程式碼

首先呼叫rangeCheck(int index)方法檢查下標是否超出了範圍,然後通過呼叫封裝好的elementData(int index)方法獲取index對應的元素。

6. ArrayList 查詢資料

6.1 indexOf(Object o)

    public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }
複製程式碼

indexOf分兩種情況,如果查詢的物件為null,則通過for迴圈找到第一個為null的元素的位置並返回了;如果查詢的物件不為null,則通過呼叫equals()方法判斷是否同一個元素,找到即返回位置;如果沒找到返回-1。

6.2 lastIndexOf(Object o)

    public int lastIndexOf(Object o) {
        if (o == null) {
            for (int i = size-1; i >= 0; i--)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = size-1; i >= 0; i--)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }
複製程式碼

lastIndexOf()方法跟indexOf()方法唯一的區別就是它的for迴圈是從後往前的。

6.3 contains(Object o)

    public boolean contains(Object o) {
        return indexOf(o) >= 0;
    }
複製程式碼

contains方法是通過呼叫indexOf方法實現的,如果indexOf方法返回的數字大於等於零,說明物件o存在,否則返回-1。

7. ArrayList 刪除資料

7.1 remove(int index)

remove(int index)方法用來刪除指定下標的元素:

    public E remove(int index) {
        rangeCheck(index);
        modCount++;
        E oldValue = elementData(index);
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,numMoved);
        elementData[--size] = null; // clear to let GC do its work
        return oldValue;
    }
複製程式碼

remove方法的操作是,把index後面的元素都往前移一位,然後刪除最後一個元素。

7.2 remove(Object o)

remove(Object o) 可以用來刪除某指定元素

    public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }
複製程式碼

該方法跟indexOf(Object o)非常相似。remove(Object o)方法找到元素所在位置後,呼叫fastRemove(int index)方法刪除元素:

    private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }
複製程式碼

fastRemove(int index)跟remove(int index)方法的區別是,它不檢查index,也不返回刪除的元素。

8. ArrayList 修改資料

ArrayList提供了set(int index, E element)方法來更新某位置的值,也比較簡單:

    public E set(int index, E element) {
        rangeCheck(index);
        E oldValue = elementData(index);
        elementData[index] = element;
        return oldValue;
    }
複製程式碼

先呼叫rangeCheck()方法保證index合法,接下來呼叫elementData()方法獲取index位置的元素並儲存在區域性變數oldValue中,然後將該位置的元素更新為element,最後返回oldValue。

9. 其他

9.1 trimToSize()

trimToSize()方法可以用來將物件陣列的大小壓縮到跟size一樣大:

    public void trimToSize() {
        modCount++;
        if (size < elementData.length) {
            elementData = Arrays.copyOf(elementData, size);
        }
    }
複製程式碼

9.2 size()

size()方法返回當前包含的元素大小

    public int size() {
        return size;
    }
複製程式碼

9.3 isEmpty()

判斷當前ArrayList內的元素是否為空

    public boolean isEmpty() {
        return size == 0;
    }
複製程式碼

9.4 toArray()

返回包含當前ArrayList全部元素的物件陣列

    public Object[] toArray() {
        return Arrays.copyOf(elementData, size);
    }
複製程式碼

9.5 clear()

清除當前ArrayList中全部元素

    public void clear() {
        modCount++;
        for (int i = 0; i < size; i++)
            elementData[i] = null;
        size = 0;
    }
複製程式碼

就把物件陣列中每個元素設為null,然後size重置為0。

9.6 sort(Comparator<? super E> c)

根據傳進來的Comparator對ArrayList中的元素進行排序:

    public void sort(Comparator<? super E> c) {
        final int expectedModCount = modCount;
        Arrays.sort((E[]) elementData, 0, size, c);
        if (modCount != expectedModCount) {
            throw new ConcurrentModificationException();
        }
        modCount++;
    }
複製程式碼

具體的排序通過呼叫Arrays中的靜態方法sort(T[] a, int fromIndex, int toIndex,Comparator<? super T> c)。

10. 參考

相關文章