通俗易懂,JDK 併發容器總結

SnailClimb發表於2019-01-19

該文已加入開源專案:JavaGuide(一份涵蓋大部分Java程式設計師所需要掌握的核心知識的文件類專案,Star 數接近 14 k)。地址:https://github.com/Snailclimb…

一 JDK 提供的併發容器總結

實戰Java高併發程式設計》為我們總結了下面幾種大家可能會在高併發程式設計中經常遇到和使用的 JDK 為我們提供的併發容器。先帶大家概覽一下,下面會一一介紹到。

JDK提供的這些容器大部分在 java.util.concurrent 包中。

  • ConcurrentHashMap: 執行緒安全的HashMap
  • CopyOnWriteArrayList: 執行緒安全的List,在讀多寫少的場合效能非常好,遠遠好於Vector.
  • ConcurrentLinkedQueue:高效的併發佇列,使用連結串列實現。可以看做一個執行緒安全的 LinkedList,這是一個非阻塞佇列。
  • BlockingQueue: 這是一個介面,JDK內部通過連結串列、陣列等方式實現了這個介面。表示阻塞佇列,非常適合用於作為資料共享的通道。
  • ConcurrentSkipListMap: 跳錶的實現。這是一個Map,使用跳錶的資料結構進行快速查詢。

二 ConcurrentHashMap

我們知道 HashMap 不是執行緒安全的,在併發場景下如果要保證一種可行的方式是使用 Collections.synchronizedMap() 方法來包裝我們的 HashMap。但這是通過使用一個全域性的鎖來同步不同執行緒間的併發訪問,因此會帶來不可忽視的效能問題。

所以就有了 HashMap 的執行緒安全版本—— ConcurrentHashMap 的誕生。在ConcurrentHashMap中,無論是讀操作還是寫操作都能保證很高的效能:在進行讀操作時(幾乎)不需要加鎖,而在寫操作時通過鎖分段技術只對所操作的段加鎖而不影響客戶端對其它段的訪問。

關於 ConcurrentHashMap 相關問題,我在 《這幾道Java集合框架面試題幾乎必問》 這篇文章中已經提到過。下面梳理一下關於 ConcurrentHashMap 比較重要的問題:

三 CopyOnWriteArrayList

3.1 CopyOnWriteArrayList 簡介

public class CopyOnWriteArrayList<E>
extends Object
implements List<E>, RandomAccess, Cloneable, Serializable

在很多應用場景中,讀操作可能會遠遠大於寫操作。由於讀操作根本不會修改原有的資料,因此對於每次讀取都進行加鎖其實是一種資源浪費。我們應該允許多個執行緒同時訪問List的內部資料,畢竟讀取操作是安全的。

這和我們之前在多執行緒章節講過 ReentrantReadWriteLock 讀寫鎖的思想非常類似,也就是讀讀共享、寫寫互斥、讀寫互斥、寫讀互斥。JDK中提供了 CopyOnWriteArravList 類比相比於在讀寫鎖的思想又更進一步。為了將讀取的效能發揮到極致,CopyOnWriteArravList 讀取是完全不用加鎖的,並且更厲害的是:寫入也不會阻塞讀取操作。只有寫入和寫入之間需要進行同步等待。這樣一來,讀操作的效能就會大幅度提升。那它是怎麼做的呢?

3.2 CopyOnWriteArravList 是如何做到的?

CopyOnWriteArravList 類的所有可變操作(add,set等等)都是通過建立底層陣列的新副本來實現的。當 List 需要被修改的時候,我並不修改原有內容,而是對原有資料進行一次複製,將修改的內容寫入副本。寫完之後,再將修改完的副本替換原來的資料,這樣就可以保證寫操作不會影響讀操作了。

CopyOnWriteArravList 的名字就能看出CopyOnWriteArravList 是滿足CopyOnWrite 的ArrayList,所謂CopyOnWrite 也就是說:在計算機,如果你想要對一塊記憶體進行修改時,我們不在原有記憶體塊中進行寫操作,而是將記憶體拷貝一份,在新的記憶體中進行寫操作,寫完之後呢,就將指向原來記憶體指標指向新的記憶體,原來的記憶體就可以被回收掉了。

3.3 CopyOnWriteArravList 讀取和寫入原始碼簡單分析

3.3.1 CopyOnWriteArravList 讀取操作的實現

讀取操作沒有任何同步控制和鎖操作,理由就是內部陣列 array 不會發生修改,只會被另外一個 array 替換,因此可以保證資料安全。

    /** The array, accessed only via getArray/setArray. */
    private transient volatile Object[] array;
    public E get(int index) {
        return get(getArray(), index);
    }
    @SuppressWarnings("unchecked")
    private E get(Object[] a, int index) {
        return (E) a[index];
    }
    final Object[] getArray() {
        return array;
    }

3.3.2 CopyOnWriteArravList 寫入操作的實現

CopyOnWriteArravList 寫入操作 add() 方法在新增集合的時候加了鎖,保證了同步,避免了多執行緒寫的時候會 copy 出多個副本出來。

    /**
     * Appends the specified element to the end of this list.
     *
     * @param e element to be appended to this list
     * @return {@code true} (as specified by {@link Collection#add})
     */
    public boolean add(E e) {
        final ReentrantLock lock = this.lock;
        lock.lock();//加鎖
        try {
            Object[] elements = getArray();
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len + 1);//拷貝新陣列
            newElements[len] = e;
            setArray(newElements);
            return true;
        } finally {
            lock.unlock();//釋放鎖
        }
    }

四 ConcurrentLinkedQueue

Java提供的執行緒安全的 Queue 可以分為阻塞佇列非阻塞佇列,其中阻塞佇列的典型例子是 BlockingQueue,非阻塞佇列的典型例子是ConcurrentLinkedQueue,在實際應用中要根據實際需要選用阻塞佇列或者非阻塞佇列。 阻塞佇列可以通過加鎖來實現,非阻塞佇列可以通過 CAS 操作實現。

從名字可以看出,ConcurrentLinkedQueue這個佇列使用連結串列作為其資料結構.ConcurrentLinkedQueue 應該算是在高併發環境中效能最好的佇列了。它之所有能有很好的效能,是因為其內部複雜的實現。

ConcurrentLinkedQueue 內部程式碼我們就不分析了,大家知道ConcurrentLinkedQueue 主要使用 CAS 非阻塞演算法來實現執行緒安全就好了。

ConcurrentLinkedQueue 適合在對效能要求相對較高,同時對佇列的讀寫存在多個執行緒同時進行的場景,即如果對佇列加鎖的成本較高則適合使用無鎖的ConcurrentLinkedQueue來替代。

五 BlockingQueue

5.1 BlockingQueue 簡單介紹

上面我們己經提到了 ConcurrentLinkedQueue 作為高效能的非阻塞佇列。下面我們要講到的是阻塞佇列——BlockingQueue。阻塞佇列(BlockingQueue)被廣泛使用在“生產者-消費者”問題中,其原因是BlockingQueue提供了可阻塞的插入和移除的方法。當佇列容器已滿,生產者執行緒會被阻塞,直到佇列未滿;當佇列容器為空時,消費者執行緒會被阻塞,直至佇列非空時為止。

BlockingQueue 是一個介面,繼承自 Queue,所以其實現類也可以作為 Queue 的實現來使用,而 Queue 又繼承自 Collection 介面。下面是 BlockingQueue 的相關實現類:

BlockingQueue 的實現類

下面主要介紹一下:ArrayBlockingQueue、LinkedBlockingQueue、PriorityBlockingQueue,這三個 BlockingQueue 的實現類。

5.2 ArrayBlockingQueue

ArrayBlockingQueue 是 BlockingQueue 介面的有界佇列實現類,底層採用陣列來實現。ArrayBlockingQueue一旦建立,容量不能改變。其併發控制採用可重入鎖來控制,不管是插入操作還是讀取操作,都需要獲取到鎖才能進行操作。當佇列容量滿時,嘗試將元素放入佇列將導致操作阻塞;嘗試從一個空佇列中取一個元素也會同樣阻塞。

ArrayBlockingQueue 預設情況下不能保證執行緒訪問佇列的公平性,所謂公平性是指嚴格按照執行緒等待的絕對時間順序,即最先等待的執行緒能夠最先訪問到 ArrayBlockingQueue。而非公平性則是指訪問 ArrayBlockingQueue 的順序不是遵守嚴格的時間順序,有可能存在,當 ArrayBlockingQueue 可以被訪問時,長時間阻塞的執行緒依然無法訪問到 ArrayBlockingQueue。如果保證公平性,通常會降低吞吐量。如果需要獲得公平性的 ArrayBlockingQueue,可採用如下程式碼:

private static ArrayBlockingQueue<Integer> blockingQueue = new ArrayBlockingQueue<Integer>(10,true);

5.3 LinkedBlockingQueue

LinkedBlockingQueue 底層基於單向連結串列實現的阻塞佇列,可以當做無界佇列也可以當做有界佇列來使用,同樣滿足FIFO的特性,與ArrayBlockingQueue 相比起來具有更高的吞吐量,為了防止 LinkedBlockingQueue 容量迅速增,損耗大量記憶體。通常在建立LinkedBlockingQueue 物件時,會指定其大小,如果未指定,容量等於Integer.MAX_VALUE。

相關構造方法:

    /**
     *某種意義上的無界佇列
     * Creates a {@code LinkedBlockingQueue} with a capacity of
     * {@link Integer#MAX_VALUE}.
     */
    public LinkedBlockingQueue() {
        this(Integer.MAX_VALUE);
    }

    /**
     *有界佇列
     * Creates a {@code LinkedBlockingQueue} with the given (fixed) capacity.
     *
     * @param capacity the capacity of this queue
     * @throws IllegalArgumentException if {@code capacity} is not greater
     *         than zero
     */
    public LinkedBlockingQueue(int capacity) {
        if (capacity <= 0) throw new IllegalArgumentException();
        this.capacity = capacity;
        last = head = new Node<E>(null);
    }

5.4 PriorityBlockingQueue

PriorityBlockingQueue 是一個支援優先順序的無界阻塞佇列。預設情況下元素採用自然順序進行排序,也可以通過自定義類實現 compareTo() 方法來指定元素排序規則,或者初始化時通過構造器引數 Comparator 來指定排序規則。

PriorityBlockingQueue 併發控制採用的是 ReentrantLock,佇列為無界佇列(ArrayBlockingQueue 是有界佇列,LinkedBlockingQueue 也可以通過在建構函式中傳入 capacity 指定佇列最大的容量,但是 PriorityBlockingQueue 只能指定初始的佇列大小,後面插入元素的時候,如果空間不夠的話會自動擴容)。

簡單地說,它就是 PriorityQueue 的執行緒安全版本。不可以插入 null 值,同時,插入佇列的物件必須是可比較大小的(comparable),否則報 ClassCastException 異常。它的插入操作 put 方法不會 block,因為它是無界佇列(take 方法在佇列為空的時候會阻塞)。

推薦文章:

《解讀 Java 併發佇列 BlockingQueue》

https://javadoop.com/post/java-concurrent-queue

六 ConcurrentSkipListMap

下面這部分內容參考了極客時間專欄《資料結構與演算法之美》以及《實戰Java高併發程式設計》。

為了引出ConcurrentSkipListMap,先帶著大家簡單理解一下跳錶。

對於一個單連結串列,即使連結串列是有序的,如果我們想要在其中查詢某個資料,也只能從頭到尾遍歷連結串列,這樣效率自然就會很低,跳錶就不一樣了。跳錶是一種可以用來快速查詢的資料結構,有點類似於平衡樹。它們都可以對元素進行快速的查詢。但一個重要的區別是:對平衡樹的插入和刪除往往很可能導致平衡樹進行一次全域性的調整。而對跳錶的插入和刪除只需要對整個資料結構的區域性進行操作即可。這樣帶來的好處是:在高併發的情況下,你會需要一個全域性鎖來保證整個平衡樹的執行緒安全。而對於跳錶,你只需要部分鎖即可。這樣,在高併發環境下,你就可以擁有更好的效能。而就查詢的效能而言,跳錶的時間複雜度也是 O(logn) 所以在併發資料結構中,JDK 使用跳錶來實現一個 Map。

跳錶的本質是同時維護了多個連結串列,並且連結串列是分層的,

2級索引跳錶

最低層的連結串列維護了跳錶內所有的元素,每上面一層連結串列都是下面一層的了集。

跳錶內的所有連結串列的元素都是排序的。查詢時,可以從頂級連結串列開始找。一旦發現被查詢的元素大於當前連結串列中的取值,就會轉入下一層連結串列繼續找。這也就是說在查詢過程中,搜尋是跳躍式的。如上圖所示,在跳錶中查詢元素18。

在跳錶中查詢元素18

查詢18 的時候原來需要遍歷 18 次,現在只需要 7 次即可。針對連結串列長度比較大的時候,構建索引查詢效率的提升就會非常明顯。

從上面很容易看出,跳錶是一種利用空間換時間的演算法。

使用跳錶實現Map 和使用雜湊演算法實現Map的另外一個不同之處是:雜湊並不會儲存元素的順序,而跳錶內所有的元素都是排序的。因此在對跳錶進行遍歷時,你會得到一個有序的結果。所以,如果你的應用需要有序性,那麼跳錶就是你不二的選擇。JDK 中實現這一資料結構的類是ConcurrentSkipListMap。

七 參考

ThoughtWorks准入職Java工程師。專注Java知識分享!開源 Java 學習指南——JavaGuide(12k+ Star)的作者。公眾號多篇文章被各大技術社群轉載。公眾號後臺回覆關鍵字“1”可以領取一份我精選的Java資源哦!

我的公眾號

相關文章