先看再點贊,給自己一點思考的時間,微信搜尋【沉默王二】關注這個靠才華苟且的程式設計師。
本文 GitHub github.com/itwanger 已收錄,裡面還有一線大廠整理的面試題,以及我的系列文章。
hello,同學們,大家好,我是沉默王二,在我為數不多的面試經歷中,有一位姓馬的面試官令我印象深刻,九年過去了,我還能記得他為數不多的髮量。
老馬:“兄弟,ArrayList 是執行緒安全的嗎?”
王二:“不是啊。”
老馬:“那有沒有執行緒安全的 List?”
王二:“有啊,Vector。”
老馬:“還有別的嗎?”
王二:“Vector 不就夠用了嗎?”
老馬看了一下左手腕上的表,說道:“今天差不多就到這裡吧,你回去等通知。”
(不是,我特麼不是剛進來,就回答了三個問題而已,就到這了?)
現在回想起來當時一臉懵逼的樣子,臉上情不自禁地泛起了紅暈,老馬的意思是讓我說說 Java 的 CopyOnWriteArrayList,可惜我當時幾乎沒怎麼用過這個類,也不知道它就是個執行緒安全的 List,慚愧啊慚愧。
(地上有坑嗎?我想跳進去。)
真正的勇士敢於直面過去的慘淡,經過這麼多年的努力,我的技術功底已經大有長進了,是時候輸出一波傷害了。希望這篇文章能夠給不太瞭解 CopyOnWriteArrayList 的同學一點點幫助,到時候給面試官一個好看。
注:我用的是 OpenJDK 14。
01、Vector
Vector 的原始碼文件上直截了當地說了,“如果不需要執行緒安全,推薦使用 ArrayList 替代 Vector。”說實話,在我十多年的程式設計生涯中,的確很少使用 Vector,因為它的執行緒安全是建立在每個方法上都加了 synchronized
關鍵字的基礎上,鎖的粒度很高,意味著效能就不咋滴。
public synchronized boolean add(E e) {
modCount++;
add(e, elementData, elementCount);
return true;
}
public synchronized E remove(int index) {
modCount++;
if (index >= elementCount)
throw new ArrayIndexOutOfBoundsException(index);
E oldValue = elementData(index);
int numMoved = elementCount - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--elementCount] = null; // Let gc do its work
return oldValue;
}
就連 size()
這樣的方法上都加了 synchronized,可想而知,Vector 有多鋪張浪費,有多錦衣玉食。
如果對 synchronized 關鍵字不太瞭解的話,可以點選下面的連結檢視我之前寫的一篇文章。
高併發的情況下,一般都要求效能要給力,Vector 顯然不夠格,所以被遺忘在角落也是“罪有應得”啊。
02、SynchronizedList
那有些同學可能會說,可以使用 Collections.synchronizedList()
讓 ArrayList 變成執行緒安全啊。
public static <T> List<T> synchronizedList(List<T> list) {
return (list instanceof RandomAccess ?
new Collections.SynchronizedRandomAccessList<>(list) :
new Collections.SynchronizedList<>(list));
}
無論是 SynchronizedRandomAccessList 還是 SynchronizedList,它們都沒有在方法級別上使用 synchronized 關鍵字,而是在方法體內使用了 synchronized(this)
塊。
public void add(int index, E element) {
synchronized (mutex) {list.add(index, element);}
}
public E remove(int index) {
synchronized (mutex) {return list.remove(index);}
}
其中 mutex 為 this 關鍵字,也就是當前物件。
final Object mutex; // Object on which to synchronize
SynchronizedCollection(Collection<E> c) {
this.c = Objects.requireNonNull(c);
mutex = this;
}
03、ConcurrentModificationException
ConcurrentModificationException 這個異常不知道同學們有沒有遇到過?我先來敲段程式碼讓它發生一次,讓同學們認識一下。
List<String> list = new ArrayList<>();
list.add("沉默王二");
list.add("沉默王三");
list.add("一個文章真特麼有趣的程式設計師");
for (String str : list) {
if ("沉默王二".equals(str)) {
list.remove(str);
}
}
System.out.println(list);
執行這段程式碼就會丟擲 ConcurrentModificationException:
Exception in thread "main" java.util.ConcurrentModificationException
at java.base/java.util.ArrayList$Itr.checkForComodification(ArrayList.java:1012)
at java.base/java.util.ArrayList$Itr.next(ArrayList.java:966)
通過異常的堆疊資訊可以查詢到,異常發生在 ArrayList 的內部類 Itr 的 checkForComodification()
方法中。
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
也就是說,在執行 checkForComodification()
方法的時候,發現 modCount 和 expectedModCount 不等,就丟擲了 ConcurrentModificationException
異常。
為什麼會這樣呢?之前的程式碼也沒有呼叫 checkForComodification()
方法啊!
那就只能來看一下反編譯後的位元組碼了,原來 for-each 這個語法糖是通過 Iterator 實現的。
List<String> list = new ArrayList();
list.add("沉默王二");
list.add("沉默王三");
list.add("一個文章真特麼有趣的程式設計師");
Iterator var3 = list.iterator();
while (var3.hasNext()) {
String str = (String) var3.next();
if ("沉默王二".equals(str)) {
list.remove(str);
}
}
System.out.println(list);
在執行 list.iterator()
的時候,其實返回的就是 ArrayList 的內部類 Itr。
public Iterator<E> iterator() {
return new ArrayList.Itr();
}
迭代器 Iterator 是 fail-fast 的,如果以任何方式(包括 remove 和
add)對迭代器進行修改的話,就會丟擲 ConcurrentModificationException。
迭代器在執行 remove()
方法的時候,會對 modCount 加 1。remove()
方法內部會呼叫 fastRemove()
方法。
private void fastRemove(Object[] es, int i) {
modCount++;
final int newSize;
if ((newSize = size - 1) > i)
System.arraycopy(es, i + 1, es, i, newSize - i);
es[size = newSize] = null;
}
當在進行下一次 next()
會執行 checkForComodification()
方法,結果發現 modCount 為 4,而 expectedModCount 為 3,於是就丟擲了異常。
之所以在單執行緒的情況下就丟擲 ConcurrentModificationException,就是為了在多執行緒併發的情況下,不冒任何的危險,提前規避掉其他執行緒對 List 修改的可能性。
ArrayList 返回的迭代器是 fail-fast 的,Vector 的也是,SynchronizedList 的也是。這就意味著它們在多執行緒環境下通過 for-each 遍歷進行增刪操作的時候會出問題。
04、CopyOnWriteArrayList
瞧,為了引出 CopyOnWriteArrayList,我花了多少心思。
List<String> list = new CopyOnWriteArrayList();
list.add("沉默王二");
list.add("沉默王三");
list.add("一個文章真特麼有趣的程式設計師");
for (String str : list) {
if ("沉默王二".equals(str)) {
list.remove(str);
}
}
System.out.println(list);
把 ArrayList 換成 CopyOnWriteArrayList,程式就能夠正常執行了,輸出結果如下所示。
[沉默王三, 一個文章真特麼有趣的程式設計師]
之所以不丟擲 ConcurrentModificationException 異常,是因為 CopyOnWriteArrayList 是 fail-safe 的,迭代器遍歷的是原有的陣列,remove 的時候 remove 的是複製後的新陣列,然後再將新陣列賦值給原有的陣列。
不過,任何在獲取迭代器之後對 CopyOnWriteArrayList 的修改將不會及時反映迭代器裡。
CopyOnWriteArrayList<String> list1 =
new CopyOnWriteArrayList<>(new String[] {"沉默王二", "沉默王三"});
Iterator itr = list1.iterator();
list1.add("沉默王四");
while(itr.hasNext()) {
System.out.print(itr.next() + " ");
}
沉默王四並不會出現在輸出結果中。
沉默王二 沉默王三
ArrayList 的迭代器 Itr 是支援 remove 的。
List<String> list = new ArrayList();
list.add("沉默王二");
list.add("沉默王三");
list.add("一個文章真特麼有趣的程式設計師");
Iterator var3 = list.iterator();
while (var3.hasNext()) {
String str = (String) var3.next();
if ("沉默王二".equals(str)) {
var3.remove();
}
}
System.out.println(list);
程式輸出的結果如下所示:
[沉默王三, 一個文章真特麼有趣的程式設計師]
而 CopyOnWriteArrayList 的迭代器 COWIterator 是不支援 remove 的。
public void remove() {
throw new UnsupportedOperationException();
}
CopyOnWriteArrayList 實現了 List 介面,不過,它不在 java.util 包下,而在 java.util.concurrent 包下,算作是 ArrayList 的增強版,執行緒安全的。
顧名思義,CopyOnWriteArrayList 在進行寫操作(add、set、remove)的時候會先進行拷貝,底層是通過陣列複製來實現的。
Java 8 的時候,CopyOnWriteArrayList 的增刪改操作方法使用的是 ReentrantLock(可重入鎖,一個執行緒獲得了鎖之後仍然可以反覆的加鎖,不會出現自己阻塞自己的情況)。
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}
Java 14 的時候,已經改成 synchronized 塊了。
public boolean add(E e) {
synchronized (lock) {
Object[] es = getArray();
int len = es.length;
es = Arrays.copyOf(es, len + 1);
es[len] = e;
setArray(es);
return true;
}
}
其中的 lock 是一個 Object 物件(註釋上說和 ReentrantLock 有一點關係)。
/**
* The lock protecting all mutators. (We have a mild preference
* for builtin monitors over ReentrantLock when either will do.)
*/
final transient Object lock = new Object();
使用 ReentrantLock 效能更好,還是 synchronized 塊效能更好,同學們可以試驗一下。不過,從另外一些細節上看,Java 14 的寫法比 Java 8 更簡潔一些,其中就少了一個 newElements 變數的建立。
再來看 set()
方法:
public E set(int index, E element) {
synchronized (lock) {
Object[] es = getArray();
E oldValue = elementAt(es, index);
if (oldValue != element) {
es = es.clone();
es[index] = element;
}
// Ensure volatile write semantics even when oldvalue == element
setArray(es);
return oldValue;
}
}
同樣使用了 synchronized 塊,並且呼叫了封裝好的 clone()
方法進行了複製。
然後來看 remove()
方法:
public E remove(int index) {
synchronized (lock) {
Object[] es = getArray();
int len = es.length;
E oldValue = elementAt(es, index);
int numMoved = len - index - 1;
Object[] newElements;
if (numMoved == 0)
newElements = Arrays.copyOf(es, len - 1);
else {
newElements = new Object[len - 1];
System.arraycopy(es, 0, newElements, 0, index);
System.arraycopy(es, index + 1, newElements, index,
numMoved);
}
setArray(newElements);
return oldValue;
}
}
synchronized 塊是必須的,陣列複製(System.arraycopy()
)也是必須的。
和 Vector 不同的是,CopyOnWriteArrayList 的 get()
、size()
方法不再加鎖。
public int size() {
return getArray().length;
}
public E get(int index) {
return elementAt(getArray(), index);
}
簡單總結一下就是:第一,CopyOnWriteArrayList 在修改時,複製出一個新陣列,修改的操作在新陣列中完成,最後將新陣列賦值給原有的陣列引用。第二,CopyOnWriteArrayList 的寫加鎖,讀不加鎖。
CopyOnWriteArrayList 有很多優勢,但陣列複製是沉重的,如果寫的操作比較多,而讀的操作比較少,記憶體就會被佔用得比較多;另外,CopyOnWriteArrayList 無法保證資料是實時同步的,因為讀寫操作是分離的,寫的操作都建立在複製的新陣列上,而讀的是原有的陣列。
05、最後
如果九年前,我就看到了這樣一篇文章,一定就不會被老馬刁難呢,保不準還能再拖延半個小時,讓他多問二十個問題。但我想同學們一定是比我幸運的,至少現在看到了,不晚,對不對?
我是沉默王二,一枚有顏值卻靠才華苟且的程式設計師。關注即可提升學習效率,別忘了三連啊,點贊、收藏、留言,我不挑,奧利給。
注:如果文章有任何問題,歡迎毫不留情地指正。
如果你覺得文章對你有些幫助歡迎微信搜尋「沉默王二」第一時間閱讀,回覆「小白」更有我肝了 4 萬+字的 Java 小白手冊 2.0 版,本文 GitHub github.com/itwanger 已收錄,歡迎 star。