Java集合乾貨1——ArrayList原始碼分析

冰洋發表於2018-01-13

前言

在之前的文章中我們提到過ArrayList，ArrayList可以說是每一個學java的人使用最多最熟練的集合了，但是知其然不知其所以然。關於ArrayList的具體實現，一些基本的都也知道，譬如陣列實現，執行緒不安全等等，但是更加具體的就很少去了解了，例如：初始化的長度，擴容等。

本篇主要通過一些對原始碼的分析，講解幾個ArrayList常見的方法，以及和Vector的區別。

ArrayList

定義

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
複製程式碼

ArrayList實際上是一個動態陣列，容量可以動態的增長，其繼承了AbstractList，實現了List, RandomAccess, Cloneable, java.io.Serializable這些介面。

RandomAccess介面，被List實現之後，表明List提供了隨機訪問功能，也就是通過下標獲取元素物件的功能。

1.RandomAccess介面，標記介面，表明List提供了隨機訪問功能，也就是通過下標獲取元素物件的功能。之所以是標記介面，是該類本來就具有某項能力，使用介面對其進行標籤化，便於其他的類對其進行識別（instanceof）。 2.ArrayList陣列實現，本身就有通過下標隨機訪問任意元素的功能。那麼需要細節上注意的就是隨機下標訪問和順序下標訪問（LinkedList）的不同了。也就是為什麼LinkedList最好不要使用迴圈遍歷，而是用迭代器遍歷的原因。 3.實現RandomAccess同時意味著一些演算法可以通過型別判斷進行一些針對性優化，例子有Collections的shuffle方法，原始碼就不貼上了，簡單說就是，如果實現RandomAccess介面就下標遍歷，反之迭代器遍歷實現了Cloneable, java.io.Serializable意味著可以被克隆和序列化。

初始化

在使用中我們經常需要new出來各種泛型的ArrayList，那麼在初始化過程是怎樣的呢？

如下一行程式碼，建立一個ArrayList物件

List<Person> list = new ArrayList<>();
複製程式碼

我們來看原始碼，是如何初始化的，找到構造方法

//無參構造方法
public ArrayList() {
  super();
  this.elementData = EMPTY_ELEMENTDATA;
}
複製程式碼

看到這些程式碼的時候，我也是不解的，elementData和EMPTY_ELEMENTDATA是什麼啊？但是很明顯EMPTY_ELEMENTDATA是一個常量，追本溯源我們去看一下成員屬性。

//如果是無參構造方法建立物件的話，ArrayList的初始化長度為10，這是一個靜態常量
private static final int DEFAULT_CAPACITY = 10;

//在這裡可以看到我們不解的EMPTY_ELEMENTDATA實際上是一個空的物件陣列
    private static final Object[] EMPTY_ELEMENTDATA = {};

//儲存ArrayList資料的物件陣列緩衝區 空的ArrayList的elementData = EMPTY_ELEMENTDATA 這就是為什麼說ArrayList底層是陣列實現的了。elementData的初始容量為10，大小會根據ArrayList容量的增長而動態的增長。
    private transient Object[] elementData;
//集合的長度
    private int size;
複製程式碼

執行完構造方法，如下圖

可以說ArrayList的作者真的是很貼心，連快取都處理好了，多次new出來的新物件，都執行同一個引用。

新增方法add

add(E e)

 /**
     * Appends the specified element to the end of this list.
     */
//增加元素到集合的最後
public boolean add(E e) {
  ensureCapacityInternal(size + 1);  // Increments modCount!!
  //因為++運算子的特點 先使用後運算  這裡實際上是
  //elementData[size] = e
  //size+1
  elementData[size++] = e;
  return true;
}
複製程式碼

先不管ensureCapacityInternal的話，這個方法就是將一個元素增加到陣列的size++位置上。

再說回ensureCapacityInternal，它是用來擴容的，準確說是用來進行擴容檢查的。下面我們來看一下整個擴容的過程

//初始長度是10，size預設值0，假定新增的是第一個元素，那麼minCapacity=1 這是最小容量 如果小於這個容量就會報錯
//如果底層陣列就是預設陣列，那麼選一個大的值，就是10
private void ensureCapacityInternal(int minCapacity) {
        if (elementData == EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }
		//呼叫另一個方法ensureExplicitCapacity
        ensureExplicitCapacity(minCapacity);
    }

    private void ensureExplicitCapacity(int minCapacity) {
      //記錄修改的次數
        modCount++;

        // overflow-conscious code
      //如果傳過來的值大於初始長度 執行grow方法（引數為傳過來的值）擴容
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }
//真正的擴容
 private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
   //新的容量是在原有的容量基礎上+50% 右移一位就是二分之一
        int newCapacity = oldCapacity + (oldCapacity >> 1);
   //如果新容量小於最小容量，按照最小容量進行擴容
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
   //這裡是重點 呼叫工具類Arrays的copyOf擴容
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

//Arrays
public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
  T[] copy = ((Object)newType == (Object)Object[].class)
    ? (T[]) new Object[newLength]
    : (T[]) Array.newInstance(newType.getComponentType(), newLength);
  System.arraycopy(original, 0, copy, 0,
                   Math.min(original.length, newLength));
  return copy;
}


複製程式碼

add(int index, E element)

新增到指定的位置

public void add(int index, E element) {
  //判斷索引是否越界，如果越界就會丟擲下標越界異常
  rangeCheckForAdd(index);
//擴容檢查
  ensureCapacityInternal(size + 1);  // Increments modCount!!
  //將指定下標空出 具體作法就是index及其後的所有元素後移一位
  System.arraycopy(elementData, index, elementData, index + 1,size - index);
  //將要新增元素賦值到空出來的指定下標處
  elementData[index] = element;
  //長度加1
  size++;
}
//判斷是否出現下標是否越界
private void rangeCheckForAdd(int index) {
  //如果下標超過了集合的尺寸 或者 小於0就是越界  
  if (index > size || index < 0)
    throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
複製程式碼

remove(int index)

ArrayList支援兩種刪除元素的方式

remove(int index) 按照下標刪除常用
remove(Object o) 按照元素刪除會刪除和引數匹配的第一個元素

下面我們看一下ArrayList的實現

 /**
 移除list中指定位置的元素
     * Removes the element at the specified position in this list.
     所有後續元素左移 下標減1
     * Shifts any subsequent elements to the left (subtracts one from their
     * indices).
     *引數是要移除元素的下標
     * @param index the index of the element to be removed
     返回值是被移除的元素
     * @return the element that was removed from the list
     * @throws IndexOutOfBoundsException {@inheritDoc}
     */
public E remove(int index) {
  //下標越界檢查
  rangeCheck(index);
//修改次數統計
  modCount++;
  //獲取這個下標上的值
  E oldValue = elementData(index);
//計算出需要移動的元素個數 （因為需要將後續元素左移一位 此處計算出來的是後續元素的位數）
  int numMoved = size - index - 1;
  //如果這個值大於0 說明後續有元素需要左移  是0說明被移除的物件就是最後一位元素
  if (numMoved > 0)
    //索引index只有的所有元素左移一位  覆蓋掉index位置上的元素
    System.arraycopy(elementData, index+1, elementData, index,numMoved);
 // 將最後一個元素賦值為null  這樣就可以被gc回收了
  elementData[--size] = null; // clear to let GC do its work
//返回index位置上的元素
  return oldValue;
}

//移除特定元素
public boolean remove(Object o) {
  //如果元素是null 遍歷陣列移除第一個null
  if (o == null) {
    for (int index = 0; index < size; index++)
      if (elementData[index] == null) {
        //遍歷找到第一個null元素的下標 呼叫下標移除元素的方法
        fastRemove(index);
        return true;
      }
  } else {
    //找到元素對應的下標 呼叫下標移除元素的方法
    for (int index = 0; index < size; index++)
      if (o.equals(elementData[index])) {
        fastRemove(index);
        return true;
      }
  }
  return false;
}

//按照下標移除元素
private void fastRemove(int index) {
  modCount++;
  int numMoved = size - index - 1;
  if (numMoved > 0)
    System.arraycopy(elementData, index+1, elementData, index,
                     numMoved);
  elementData[--size] = null; // clear to let GC do its work
}
複製程式碼

ArrayList總結

底層陣列實現，使用預設構造方法初始化出來的容量是10
擴容的長度是在原長度基礎上加二分之一
實現了RandomAccess介面，底層又是陣列，get讀取元素效能很好
執行緒不安全，所有的方法均不是同步方法也沒有加鎖，因此多執行緒下慎用
順序新增很方便
刪除和插入需要複製陣列效能很差（可以使用LinkindList）

為什麼ArrayList的elementData是用transient修飾的？

transient修飾的屬性意味著不會被序列化，也就是說在序列化ArrayList的時候，不序列化elementData。

為什麼要這麼做呢？

elementData不總是滿的，每次都序列化，會浪費時間和空間
重寫了writeObject 保證序列化的時候雖然不序列化全部但是有的元素都序列化

所以說不是不序列化而是不全部序列化。

private void writeObject(java.io.ObjectOutputStream s)
        throws java.io.IOException{
// Write out element count, and any hidden stuff
int expectedModCount = modCount;
s.defaultWriteObject();
        // Write out array length
       s.writeInt(elementData.length);
    // Write out all elements in the proper order.
for (int i=0; i<size; i++)
           s.writeObject(elementData[i]);
    if (modCount != expectedModCount) {
           throw new ConcurrentModificationException();
    }
}
複製程式碼

ArrayList和Vector的區別

標準答案

ArrayList是執行緒不安全的，Vector是執行緒安全的
擴容時候ArrayList擴0.5倍，Vector擴1倍

那麼問題來了

ArrayList有沒有辦法執行緒安全？

Collections工具類有一個synchronizedList方法

可以把list變為執行緒安全的集合，但是意義不大，因為可以使用Vector

Vector為什麼是執行緒安全的？

老實講，拋開多執行緒它倆區別沒多大，但是多執行緒下就不一樣了，那麼Vector是如何實現執行緒安全的，我們來看幾個關鍵方法

public synchronized boolean add(E e) {
  modCount++;
  ensureCapacityHelper(elementCount + 1);
  elementData[elementCount++] = e;
  return true;
}

public synchronized E remove(int index) {
  modCount++;
  if (index >= elementCount)
    throw new ArrayIndexOutOfBoundsException(index);
  E oldValue = elementData(index);

  int numMoved = elementCount - index - 1;
  if (numMoved > 0)
    System.arraycopy(elementData, index+1, elementData, index,
                     numMoved);
  elementData[--elementCount] = null; // Let gc do its work

  return oldValue;
}
複製程式碼

就程式碼實現上來說，和ArrayList並沒有很多邏輯上的區別，但是在Vector的關鍵方法都使用了synchronized修飾。

Java集合乾貨——ArrayList原始碼分析
2018-01-15
Java原始碼
Java集合乾貨——CopyOnWriteArrayList原始碼分析
2019-02-24
Java原始碼
【Java集合】ArrayList原始碼分析
2021-07-12
Java原始碼
JAVA集合：ArrayList原始碼分析
2018-03-30
Java原始碼
Java 集合框架------ArrayList原始碼分析
2020-10-31
Java框架原始碼
java集合原始碼分析（三）：ArrayList
2020-12-02
Java原始碼
JAVA ArrayList集合底層原始碼分析
2022-03-08
Java原始碼
死磕 java集合之ArrayList原始碼分析
2019-04-01
Java原始碼
集合原始碼分析[3]-ArrayList 原始碼分析
2019-04-12
原始碼
Java 集合 ArrayList 原始碼分析（帶著問題看原始碼）
2018-06-22
Java原始碼
Java集合原始碼剖析——ArrayList原始碼剖析
2018-06-30
Java原始碼
【Java集合原始碼剖析】ArrayList原始碼剖析
2014-06-30
Java原始碼
Java集合之ArrayList原始碼解析
2019-01-19
Java原始碼
Java 集合框架 ArrayList 原始碼剖析
2016-05-31
Java框架原始碼
Java容器類框架分析(1)ArrayList原始碼分析
2019-01-28
Java框架原始碼
乾貨｜Java Concurrent -- FutureTask 原始碼分析
2017-12-19
Java原始碼
Java集合原始碼學習（2）ArrayList
2018-10-02
Java原始碼
集合-ArrayList 原始碼解析
2020-04-27
原始碼
Java集合-ArrayList原始碼解析-JDK1.8
2019-04-02
Java原始碼JDK
集合原始碼分析[1]-Collection 原始碼分析
2019-03-23
原始碼
java基礎：ArrayList — 原始碼分析
2018-12-16
Java原始碼
Java容器原始碼學習--ArrayList原始碼分析
2021-12-26
Java原始碼
【集合框架】JDK1.8原始碼分析之ArrayList（六）
2016-03-22
框架JDK原始碼
Java 8 ArrayList 原始碼簡單分析
2020-03-09
Java原始碼
Java類集框架 —— ArrayList原始碼分析
2019-01-16
Java框架原始碼
Java 集合包原始碼分析
2017-03-26
Java原始碼
ArrayList 原始碼分析
2020-05-11
原始碼
[原始碼分析]ArrayList
2019-02-22
原始碼
ArrayList原始碼分析
2021-03-07
原始碼
Java集合——ArrayList
2019-03-04
Java
JAVA集合-ArrayList
2018-04-25
Java
Java集合原始碼分析（十四）：TreeMap
2021-05-24
Java原始碼
Java集合原始碼分析（九）——HashSet
2020-12-09
Java原始碼
java集合原始碼分析（六）：HashMap
2020-12-16
Java原始碼HashMap
1、ArrayList原始碼解析
2022-11-22
原始碼
ArrayList方法原始碼分析
2021-05-26
原始碼
ArrayList-原始碼分析
2021-08-03
原始碼
原始碼分析之ArrayList
2017-04-12
原始碼