因為不知道Java的CopyOnWriteArrayList,面試官讓我回去等通知

沉默王二發表於2020-07-30

先看再點贊,給自己一點思考的時間,微信搜尋【沉默王二】關注這個靠才華苟且的程式設計師。
本文 GitHub github.com/itwanger 已收錄,裡面還有一線大廠整理的面試題,以及我的系列文章。

hello,同學們,大家好,我是沉默王二,在我為數不多的面試經歷中,有一位姓馬的面試官令我印象深刻,九年過去了,我還能記得他為數不多的髮量。

老馬:“兄弟,ArrayList 是執行緒安全的嗎?”
王二:“不是啊。”
老馬:“那有沒有執行緒安全的 List?”
王二:“有啊,Vector。”
老馬:“還有別的嗎?”
王二:“Vector 不就夠用了嗎?”
老馬看了一下左手腕上的表,說道:“今天差不多就到這裡吧,你回去等通知。”

(不是,我特麼不是剛進來,就回答了三個問題而已,就到這了?)

現在回想起來當時一臉懵逼的樣子,臉上情不自禁地泛起了紅暈,老馬的意思是讓我說說 Java 的 CopyOnWriteArrayList,可惜我當時幾乎沒怎麼用過這個類,也不知道它就是個執行緒安全的 List,慚愧啊慚愧。

(地上有坑嗎?我想跳進去。)

真正的勇士敢於直面過去的慘淡,經過這麼多年的努力,我的技術功底已經大有長進了,是時候輸出一波傷害了。希望這篇文章能夠給不太瞭解 CopyOnWriteArrayList 的同學一點點幫助,到時候給面試官一個好看。

注:我用的是 OpenJDK 14。

01、Vector

Vector 的原始碼文件上直截了當地說了,“如果不需要執行緒安全,推薦使用 ArrayList 替代 Vector。”說實話,在我十多年的程式設計生涯中,的確很少使用 Vector,因為它的執行緒安全是建立在每個方法上都加了 synchronized 關鍵字的基礎上,鎖的粒度很高,意味著效能就不咋滴。

public synchronized boolean add(E e) {
    modCount++;
    add(e, elementData, elementCount);
    return true;
}

public synchronized E remove(int index) {
    modCount++;
    if (index >= elementCount)
        throw new ArrayIndexOutOfBoundsException(index);
    E oldValue = elementData(index);

    int numMoved = elementCount - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                numMoved);
    elementData[--elementCount] = null// Let gc do its work

    return oldValue;
}

就連 size() 這樣的方法上都加了 synchronized,可想而知,Vector 有多鋪張浪費,有多錦衣玉食。

如果對 synchronized 關鍵字不太瞭解的話,可以點選下面的連結檢視我之前寫的一篇文章。

我去,你竟然還不會用 synchronized

高併發的情況下,一般都要求效能要給力,Vector 顯然不夠格,所以被遺忘在角落也是“罪有應得”啊。

02、SynchronizedList

那有些同學可能會說,可以使用 Collections.synchronizedList() 讓 ArrayList 變成執行緒安全啊。

public static <T> List<T> synchronizedList(List<T> list) {
    return (list instanceof RandomAccess ?
            new Collections.SynchronizedRandomAccessList<>(list) :
            new Collections.SynchronizedList<>(list));
}

無論是 SynchronizedRandomAccessList 還是 SynchronizedList,它們都沒有在方法級別上使用 synchronized 關鍵字,而是在方法體內使用了 synchronized(this) 塊。

public void add(int index, E element) {
    synchronized (mutex) {list.add(index, element);}
}
public E remove(int index) {
    synchronized (mutex) {return list.remove(index);}
}

其中 mutex 為 this 關鍵字,也就是當前物件。

final Object mutex;     // Object on which to synchronize

SynchronizedCollection(Collection<E> c) {
    this.c = Objects.requireNonNull(c);
    mutex = this;
}

03、ConcurrentModificationException

ConcurrentModificationException 這個異常不知道同學們有沒有遇到過?我先來敲段程式碼讓它發生一次,讓同學們認識一下。

List<String> list = new ArrayList<>();
list.add("沉默王二");
list.add("沉默王三");
list.add("一個文章真特麼有趣的程式設計師");

for (String str : list) {
    if ("沉默王二".equals(str)) {
        list.remove(str);
    }
}

System.out.println(list);

執行這段程式碼就會丟擲 ConcurrentModificationException:

Exception in thread "main" java.util.ConcurrentModificationException
    at java.base/java.util.ArrayList$Itr.checkForComodification(ArrayList.java:1012)
    at java.base/java.util.ArrayList$Itr.next(ArrayList.java:966)

通過異常的堆疊資訊可以查詢到,異常發生在 ArrayList 的內部類 Itr 的 checkForComodification() 方法中。

final void checkForComodification() {
    if (modCount != expectedModCount)
        throw new ConcurrentModificationException();
}

也就是說,在執行 checkForComodification() 方法的時候,發現 modCount 和 expectedModCount 不等,就丟擲了 ConcurrentModificationException 異常。

為什麼會這樣呢?之前的程式碼也沒有呼叫 checkForComodification() 方法啊!

那就只能來看一下反編譯後的位元組碼了,原來 for-each 這個語法糖是通過 Iterator 實現的。

List<String> list = new ArrayList();
list.add("沉默王二");
list.add("沉默王三");
list.add("一個文章真特麼有趣的程式設計師");
Iterator var3 = list.iterator();

while (var3.hasNext()) {
    String str = (String) var3.next();
    if ("沉默王二".equals(str)) {
        list.remove(str);
    }
}

System.out.println(list);

在執行 list.iterator() 的時候,其實返回的就是 ArrayList 的內部類 Itr。

public Iterator<E> iterator() {
    return new ArrayList.Itr();
}

迭代器 Iterator 是 fail-fast 的,如果以任何方式(包括 remove 和
add)對迭代器進行修改的話,就會丟擲 ConcurrentModificationException。

迭代器在執行 remove() 方法的時候,會對 modCount 加 1。remove() 方法內部會呼叫 fastRemove() 方法。

private void fastRemove(Object[] es, int i) {
    modCount++;
    final int newSize;
    if ((newSize = size - 1) > i)
        System.arraycopy(es, i + 1, es, i, newSize - i);
    es[size = newSize] = null;
}

當在進行下一次 next() 會執行 checkForComodification() 方法,結果發現 modCount 為 4,而 expectedModCount 為 3,於是就丟擲了異常。

之所以在單執行緒的情況下就丟擲 ConcurrentModificationException,就是為了在多執行緒併發的情況下,不冒任何的危險,提前規避掉其他執行緒對 List 修改的可能性。

ArrayList 返回的迭代器是 fail-fast 的,Vector 的也是,SynchronizedList 的也是。這就意味著它們在多執行緒環境下通過 for-each 遍歷進行增刪操作的時候會出問題。

04、CopyOnWriteArrayList

瞧,為了引出 CopyOnWriteArrayList,我花了多少心思。

List<String> list = new CopyOnWriteArrayList();
list.add("沉默王二");
list.add("沉默王三");
list.add("一個文章真特麼有趣的程式設計師");

for (String str : list) {
    if ("沉默王二".equals(str)) {
        list.remove(str);
    }
}

System.out.println(list);

把 ArrayList 換成 CopyOnWriteArrayList,程式就能夠正常執行了,輸出結果如下所示。

[沉默王三, 一個文章真特麼有趣的程式設計師]

之所以不丟擲 ConcurrentModificationException 異常,是因為 CopyOnWriteArrayList 是 fail-safe 的,迭代器遍歷的是原有的陣列,remove 的時候 remove 的是複製後的新陣列,然後再將新陣列賦值給原有的陣列。

不過,任何在獲取迭代器之後對 CopyOnWriteArrayList 的修改將不會及時反映迭代器裡。

CopyOnWriteArrayList<String> list1 =
        new CopyOnWriteArrayList<>(new String[] {"沉默王二""沉默王三"});
Iterator itr = list1.iterator();
list1.add("沉默王四");
while(itr.hasNext()) {
    System.out.print(itr.next() + " ");
}

沉默王四並不會出現在輸出結果中。

沉默王二 沉默王三 

ArrayList 的迭代器 Itr 是支援 remove 的。

List<String> list = new ArrayList();
list.add("沉默王二");
list.add("沉默王三");
list.add("一個文章真特麼有趣的程式設計師");
Iterator var3 = list.iterator();

while (var3.hasNext()) {
    String str = (String) var3.next();
    if ("沉默王二".equals(str)) {
        var3.remove();
    }
}

System.out.println(list);

程式輸出的結果如下所示:

[沉默王三, 一個文章真特麼有趣的程式設計師]

而 CopyOnWriteArrayList 的迭代器 COWIterator 是不支援 remove 的。

public void remove() {
            throw new UnsupportedOperationException();
        }

CopyOnWriteArrayList 實現了 List 介面,不過,它不在 java.util 包下,而在 java.util.concurrent 包下,算作是 ArrayList 的增強版,執行緒安全的。

顧名思義,CopyOnWriteArrayList 在進行寫操作(add、set、remove)的時候會先進行拷貝,底層是通過陣列複製來實現的。

Java 8 的時候,CopyOnWriteArrayList 的增刪改操作方法使用的是 ReentrantLock(可重入鎖,一個執行緒獲得了鎖之後仍然可以反覆的加鎖,不會出現自己阻塞自己的情況)。

public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        Object[] elements = getArray();
        int len = elements.length;
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        newElements[len] = e;
        setArray(newElements);
        return true;
    } finally {
        lock.unlock();
    }
}

Java 14 的時候,已經改成 synchronized 塊了。

public boolean add(E e) {
    synchronized (lock) {
        Object[] es = getArray();
        int len = es.length;
        es = Arrays.copyOf(es, len + 1);
        es[len] = e;
        setArray(es);
        return true;
    }
}

其中的 lock 是一個 Object 物件(註釋上說和 ReentrantLock 有一點關係)。

/**
 * The lock protecting all mutators.  (We have a mild preference
 * for builtin monitors over ReentrantLock when either will do.)
 */

final transient Object lock = new Object();

使用 ReentrantLock 效能更好,還是 synchronized 塊效能更好,同學們可以試驗一下。不過,從另外一些細節上看,Java 14 的寫法比 Java 8 更簡潔一些,其中就少了一個 newElements 變數的建立。

再來看 set() 方法:

public E set(int index, E element) {
    synchronized (lock) {
        Object[] es = getArray();
        E oldValue = elementAt(es, index);

        if (oldValue != element) {
            es = es.clone();
            es[index] = element;
        }
        // Ensure volatile write semantics even when oldvalue == element
        setArray(es);
        return oldValue;
    }
}

同樣使用了 synchronized 塊,並且呼叫了封裝好的 clone() 方法進行了複製。

然後來看 remove() 方法:

public E remove(int index) {
    synchronized (lock) {
        Object[] es = getArray();
        int len = es.length;
        E oldValue = elementAt(es, index);
        int numMoved = len - index - 1;
        Object[] newElements;
        if (numMoved == 0)
            newElements = Arrays.copyOf(es, len - 1);
        else {
            newElements = new Object[len - 1];
            System.arraycopy(es, 0, newElements, 0, index);
            System.arraycopy(es, index + 1, newElements, index,
                    numMoved);
        }
        setArray(newElements);
        return oldValue;
    }
}

synchronized 塊是必須的,陣列複製(System.arraycopy())也是必須的。

和 Vector 不同的是,CopyOnWriteArrayList 的 get()size() 方法不再加鎖。

public int size() {
    return getArray().length;
}

public E get(int index) {
    return elementAt(getArray(), index);
}

簡單總結一下就是:第一,CopyOnWriteArrayList 在修改時,複製出一個新陣列,修改的操作在新陣列中完成,最後將新陣列賦值給原有的陣列引用。第二,CopyOnWriteArrayList 的寫加鎖,讀不加鎖。

CopyOnWriteArrayList 有很多優勢,但陣列複製是沉重的,如果寫的操作比較多,而讀的操作比較少,記憶體就會被佔用得比較多;另外,CopyOnWriteArrayList 無法保證資料是實時同步的,因為讀寫操作是分離的,寫的操作都建立在複製的新陣列上,而讀的是原有的陣列。

05、最後

如果九年前,我就看到了這樣一篇文章,一定就不會被老馬刁難呢,保不準還能再拖延半個小時,讓他多問二十個問題。但我想同學們一定是比我幸運的,至少現在看到了,不晚,對不對?


我是沉默王二,一枚有顏值卻靠才華苟且的程式設計師。關注即可提升學習效率,別忘了三連啊,點贊、收藏、留言,我不挑,奧利給

注:如果文章有任何問題,歡迎毫不留情地指正。

如果你覺得文章對你有些幫助歡迎微信搜尋「沉默王二」第一時間閱讀,回覆「小白」更有我肝了 4 萬+字的 Java 小白手冊 2.0 版,本文 GitHub github.com/itwanger 已收錄,歡迎 star。

相關文章