為什麼執行緒安全的List推薦使用CopyOnWriteArrayList,而不是Vector

Java旅途發表於2020-12-28
注:本系列文章中用到的jdk版本均為java8

相比很多同學在剛接觸Java集合的時候,執行緒安全的List用的一定是Vector。但是現在用到的執行緒安全的List一般都會用CopyOnWriteArrayList,很少有人再去用Vector了,至於為什麼,文章中會具體說到。接下來,我們先來簡單分析以下Vector的原始碼。

一、Vector集合原始碼簡析

由於本文的重點不是Vector集合,因此只是簡單的分析一下Vector的初始化方法和新增元素的方法。

Vector的底層實現和ArrayList一樣,都是由陣列實現的。

Vector的主要變數如下:

/**
 * 存放元素的陣列
 */
protected Object[] elementData;
/**
 * 元素個數
 */
protected int elementCount;
/**
 * 擴容自增容量大小
 */
protected int capacityIncrement;

1.1 Vector初始化

Vector的初始化提供了三個方法,除了可以指定初始容量的大小,還可以指定擴容容量的大小。構造器分別如下:

無參構造器

public Vector() {
    this(10);
}

指定初始化容量的構造器

public Vector(int initialCapacity) {
    this(initialCapacity, 0);
}

指定初始化容量和擴容容量大小的構造器

public Vector(int initialCapacity, int capacityIncrement) {
    super();
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal Capacity: "+initialCapacity);
    this.elementData = new Object[initialCapacity];
    this.capacityIncrement = capacityIncrement;
}

從上面的構造器中可以看出,如果呼叫無參構造器,則會建立一個初始化容量為10,擴容容量為0Vector集合。

1.2 如何擴容

Vector的擴容機制和ArrayList的很像,如果不清楚ArrayList的擴容機制,可以看看這篇文章。這裡我們直接看Vector的擴容方法grow

private void grow(int minCapacity) {
    // overflow-conscious code
    // 初始化陣列的長度,預設為10
    int oldCapacity = elementData.length;
    // 是否指定擴容容量,不指定擴容為原來的2倍
    int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                     capacityIncrement : oldCapacity);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    elementData = Arrays.copyOf(elementData, newCapacity);
}

通過上面的方法,我們可以看出,如果指定了擴容容量的大小則擴容的新陣列大小為原來的陣列加上擴容容量的大小,如果不指定擴容容量的大小則擴容的新陣列大小為原來陣列大小的2倍。這樣擴容為原來的2倍是很消耗空間的,這也是Vector被棄用的原因之一。

除此之外,看過原始碼的同學可能發現了,Vector集合的所有操作元素的方法都加了synchronized關鍵字,這就導致了操作Vector的效率會非常低,在開發中,往往讀操作的使用頻率會遠高於其他操作,而CopyOnWriteArrayList 就是這樣一種讀操作效率遠高於寫操作效率的List,一起來看看。

二、CopyOnWriteArrayList原始碼簡析

CopyOnWriteArrayList 類圖:

2.1 CopyOnWrite思想

CopyOnWrite簡稱COW,根據名字來看就是寫入時複製。意思就是大家共同去訪問一個資源,如果有人想要去修改這個資源的時候,就需要複製一個副本,去修改這個副本,而對於其他人來說訪問得資源還是原來的,不會發生變化。

2.2 初始化CopyOnWriteArrayList

CopyOnWriteArrayList 底層是也是有陣列實現的。 本文我們只解讀新增元素和讀取元素的區別,刪除修改元素原理和新增元素差不多,操作時都需要進行加鎖,而讀操作不會加鎖。

CopyOnWriteArrayList 主要有以下兩個變數:

// 獨佔鎖
final transient ReentrantLock lock = new ReentrantLock();

// 存放元素的陣列
private transient volatile Object[] array;

我們仔細來分析一下上面兩個屬性,這兩個思想是 CopyOnWriteArrayList 的核心 。

  • lock:ReentrantLock,獨佔鎖,多執行緒執行的情況下,只有一個執行緒會獲得這個鎖,只有釋放鎖後其他執行緒才能獲得。
  • array:存放資料的陣列,關鍵是被volatile修飾了,被volatile修飾,就保證了可見性,也就是一個執行緒修改後,其他執行緒立即可見。

最常用的初始化方式如下:

/**
  * Creates an empty list.
  */
public CopyOnWriteArrayList() {
    setArray(new Object[0]);
}

/**
  * Sets the array.
  */
final void setArray(Object[] a) {
    array = a;
}

初始化只是建立了一個空的陣列,並將array指向它。

2.3 新增元素

public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        // 獲取原來的陣列
        Object[] elements = getArray();
        // 原來陣列的長度
        int len = elements.length;
        // 建立一個長度+1的新陣列,並將原來陣列的元素複製給新陣列
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        // 元素放在新陣列末尾
        newElements[len] = e;
        // array指向新陣列
        setArray(newElements);
        return true;
    } finally {
        lock.unlock();
    }
}

新增陣列的步驟如下:

  1. 獲得獨佔鎖,將新增功能加鎖
  2. 獲取原來的陣列,並得到其長度
  3. 建立一個長度為原來陣列長度+1的陣列,並拷貝原來的元素給新陣列
  4. 追加元素到新陣列末尾
  5. 指向新陣列
  6. 釋放鎖

這個過程是執行緒安全的,COW的核心思想就是每次修改的時候拷貝一個新的資源去修改,add()方法再拷貝新資源的時候將陣列容量+1,這樣雖然每次新增元素都會浪費一定的空間,但是陣列的長度正好是元素的長度,也在一定程度上節省了擴容的開銷。

2.4 獲取元素

public E get(int index) {
    return get(getArray(), index);
}

final Object[] getArray() {
    return array;
}

private E get(Object[] a, int index) {
    return (E) a[index];
}

讀操作是天然安全的操作,而且陣列本身會進行檢查越界問題,因此獲取元素的方法很簡單,只是根據索引獲取該元素。

public int size() {
    return getArray().length;
}

由於CopyOnWriteArrayList的底層陣列長度,本身就是元素大小,因此size()方法只要返回陣列長度就可以了。

三、總結

VectorCopyOnWriteArrayList都是執行緒安全的List,底層都是陣列實現的,Vector的每個方法都進行了加鎖,而CopyOnWriteArrayList的讀操作是不加鎖的,因此CopyOnWriteArrayList的讀效能遠高於VectorVector每次擴容的大小都是原來陣列大小的2倍,而CopyOnWriteArrayList不需要擴容,通過COW思想就能使陣列容量滿足要求。兩個集合都是先了RandomAccess介面,支援隨機讀取,因此更加推薦使用for迴圈進行遍歷。在開發中,讀操作會遠遠多於其他操作,因此使用CopyOnWriteArrayList集合效率更高。

點關注、不迷路

如果覺得文章不錯,歡迎關注、點贊、收藏,你們的支援是我創作的動力,感謝大家。

如果文章寫的有問題,請不要吝惜文筆,歡迎留言指出,我會及時核查修改。

如果你還想看到更多別的東西,可以微信搜尋「Java旅途」進行關注。「Java旅途」目前已經整理各種中介軟體的使用教程及各類Java相關的面試題。掃描下方二維碼進行關注就可以得到這些資料。

相關文章