原始碼淺入淺出 Java ConcurrentHashMap

沉默王二發表於2020-09-01

原文網址 : https://www.cnblogs.com/qing-gee/p/13594656.html

從原始碼的角度深入地分析了 ConcurrentHashMap 這個執行緒安全的 HashMap，希望能夠給你一些幫助。

老讀者就請肆無忌憚地點贊吧，微信搜尋【沉默王二】關注這個在九朝古都洛陽苟且偷生的程式設計師。
本文 GitHub github.com/itwanger 已收錄，裡面還有我精心為你準備的一線大廠面試題。

HashMap 是 Java 中非常強大的資料結構，使用頻率非常高，幾乎所有的應用程式都會用到它。但 HashMap 不是執行緒安全的，不能在多執行緒環境下使用，該怎麼辦呢？

1）Hashtable，一個老掉牙的同步雜湊表，t 竟然還是小寫的，一看就非常不專業：

public class Hashtable<K,V>
        extends Dictionary<K,V>
        implements Map<K,V>, Cloneable, java.io.Serializable {
    public synchronized V put(K key, V value) {}
    public synchronized int size() {}
    public synchronized V get(Object key) {}
}

裡面的方法全部是 synchronized，同步的力度非常大，對不對？這樣的話，效能就沒法保證了。pass。

2）Collections.synchronizedMap(new HashMap<String, String>())，可以把一個 HashMap 包裝成同步的 SynchronizedMap：

private static class SynchronizedMap<K,V>
        implements Map<K,V>, Serializable {
    public int size() {
        synchronized (mutex) {return m.size();}
    }
    public V get(Object key) {
        synchronized (mutex) {return m.get(key);}
    }
    public V put(K key, V value) {
        synchronized (mutex) {return m.put(key, value);}
    }
}

可以看得出，SynchronizedMap 確實比 Hashtable 改進了，synchronized 不再放在方法上，而是放在方法內部，作為同步塊出現，但仍然是物件級別的同步鎖，讀和寫操作都需要獲取鎖，本質上，仍然只允許一個執行緒訪問，其他執行緒被排斥在外。

3）ConcurrentHashMap，本篇的主角，唯一正確的答案。Concurrent 這個單詞就是併發、並行的意思，所以 ConcurrentHashMap 就是一個可以在多執行緒環境下使用的 HashMap。

ConcurrentHashMap 一直在進化，Java 7 和 Java 8 就有很大的不同。Java 7 版本的 ConcurrentHashMap 是基於分段鎖的，就是將內部分成不同的 Segment（段），每個段裡面是 HashEntry 陣列。

來看一下 Segment：

static final class Segment<K,V> extends ReentrantLock implements Serializable {
       transient volatile HashEntry<K,V>[] table;
       transient int count;
       transient int modCount;
       transient int threshold;
       final float loadFactor;
}

再來看一下 HashEntry：

static final class HashEntry<K,V> {
        final K key;                       // 宣告 key 為 final 型
        final int hash;                   // 宣告 hash 值為 final 型
        volatile V value;                 // 宣告 value 為 volatile 型
        final HashEntry<K,V> next;      // 宣告 next 為 final 型

        HashEntry(K key, int hash, HashEntry<K,V> next, V value) {
            this.key = key;
            this.hash = hash;
            this.next = next;
            this.value = value;
        }
 }

和 HashMap 非常相似，唯一的區別就是 value 是 volatile 的，保證 get 時候的可見性。

Segment 繼承自 ReentrantLock，所以不會像 Hashtable 那樣不管是 put 還是 get 都需要 synchronized，鎖的力度變小了，每個執行緒只鎖一個 Segment，對其他執行緒訪問的 Segment 沒有影響。

Java 8 和之後的版本在此基礎上做了很大的改進，不再採用分段鎖的機制了，而是利用 CAS（Compare and Swap，即比較並替換，實現併發演算法時常用到的一種技術）和 synchronized 來保證併發，雖然內部仍然定義了 Segment，但僅僅是為了保證序列化時的相容性，程式碼註釋上就可以看得出來：

/**
 * Stripped-down version of helper class used in previous version,
 * declared for the sake of serialization compatibility.
 */
static class Segment<K,V> extends ReentrantLock implements Serializable {
    final float loadFactor;
    Segment(float lf) { this.loadFactor = lf; }
}

底層結構和 Java 7 也有所不同，更接近 HashMap（陣列+雙向連結串列+紅黑樹）：

來看一下新版 ConcurrentHashMap 定義的關鍵欄位：

public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>
        implements ConcurrentMap<K,V>, Serializable {
    transient volatile Node<K,V>[] table;
    private transient volatile Node<K,V>[] nextTable;
    private transient volatile int sizeCtl;
}

1）table，預設為 null，第一次 put 的時候初始化，預設大小為 16，用來儲存 Node 節點，擴容時大小總是 2 的冪次方。

順帶看一下 Node 的定義：

static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        volatile V val;
        volatile Node<K,V> next;
        // … 
}

hash 和 key 是 final 的，和 HashMap 的 Node 一樣，因為 key 是不會發生變化的。val 和 next 是 volatile 的，保證多執行緒環境下的可見性。

2）nextTable，預設為 null，擴容時新生成的陣列，大小為原陣列的兩倍。

3）sizeCtl，預設為 0，用來控制 table 的初始化和擴容操作。-1 表示 table 正在初始化；-(1+執行緒數) 表示正在被多個執行緒擴容。

Map 最重要的方法就是 put，ConcurrentHashMap 也不例外：

public V put(K key, V value) {
    return putVal(key, value, false);
}

final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))
                break;                   // no lock when adding to empty bin
        }
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        ...省略部分程式碼
    }
    addCount(1L, binCount);
    return null;
}

1）spread() 是一個雜湊演算法，和 HashMap 的 hash() 方法類似：

static final int spread(int h) {
    return (h ^ (h >>> 16)) & HASH_BITS;
}

2）如果是第一次 put 的話，會呼叫 initTable() 對 table 進行初始化。

private final ConcurrentHashMap.Node<K,V>[] initTable() {
    ConcurrentHashMap.Node<K,V>[] tab; int sc;
    while ((tab = table) == null || tab.length == 0) {
        if ((sc = sizeCtl) < 0)
            Thread.yield(); // lost initialization race; just spin
        else if (U.compareAndSetInt(this, SIZECTL, sc, -1)) {
            try {
                if ((tab = table) == null || tab.length == 0) {
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    @SuppressWarnings("unchecked")
                    ConcurrentHashMap.Node<K,V>[] nt = (ConcurrentHashMap.Node<K,V>[])new ConcurrentHashMap.Node<?,?>[n];
                    table = tab = nt;
                    sc = n - (n >>> 2);
                }
            } finally {
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

外層用了一個 while 迴圈，如果發現 sizeCtl 小於 0 的話，就意味著其他執行緒正在初始化，yield 讓出 CPU。

第一次 put 的時候會執行 U.compareAndSetInt(this, SIZECTL, sc, -1)，把 sizeCtl 賦值為 -1，表示當前執行緒正在初始化。

private static final Unsafe U = Unsafe.getUnsafe();
private static final long SIZECTL
        = U.objectFieldOffset(ConcurrentHashMap.class, "sizeCtl");

U 是一個 Unsafe（可以提供硬體級別的原子操作，可以獲取某個屬性在記憶體中的位置，也可以修改物件的欄位值）物件，compareAndSetInt() 是 Unsafe 的一個本地（native）方法，它就負責把 ConcurrentHashMap 的 sizeCtl 修改為指定的值（-1）。

初始化後的 table 大小為 16（DEFAULT_CAPACITY）。

不是第一次 put 的話，會呼叫 tabAt() 取出 key 位置（(n - 1) & hash）上的值（f）：

static final <K,V> ConcurrentHashMap.Node<K,V> tabAt(ConcurrentHashMap.Node<K,V>[] tab, int i) {
    return (ConcurrentHashMap.Node<K,V>)U.getReferenceAcquire(tab, ((long)i << ASHIFT) + ABASE);
}

U.getReferenceAcquire() 會呼叫 Unsafe 的本地方法 getReferenceVolatile() 獲取指定記憶體中的資料，保證每次拿到的資料都是最新的。

如果 f 為 null，說明 table 中這個位置上是第一次 put 元素，呼叫 casTabAt() 插入 Node。

static final <K,V> boolean casTabAt(ConcurrentHashMap.Node<K,V>[] tab, int i,
                                    ConcurrentHashMap.Node<K,V> c, ConcurrentHashMap.Node<K,V> v) {
    return U.compareAndSetReference(tab, ((long)i << ASHIFT) + ABASE, c, v);
}

如果 CAS 成功，說明 Node 插入成功，執行 addCount() 方法檢查是否需要擴容。

如果失敗，說明有其他執行緒提前插入了 Node，進行下一輪 for 迴圈繼續嘗試，俗稱自旋。

如果 f 的 hash 為 MOVED（-1），意味著有其他執行緒正在擴容，執行 helpTransfer() 一起擴容。

否則，把 Node 按連結串列或者紅黑樹的方式插入到合適的位置，這個過程是通過 synchronized 塊實現的。

synchronized (f) {
    if (tabAt(tab, i) == f) {
        if (fh >= 0) {
            binCount = 1;
            for (Node<K,V> e = f;; ++binCount) {
                K ek;
                if (e.hash == hash &&
                    ((ek = e.key) == key ||
                     (ek != null && key.equals(ek)))) {
                    oldVal = e.val;
                    if (!onlyIfAbsent)
                        e.val = value;
                    break;
                }
                Node<K,V> pred = e;
                if ((e = e.next) == null) {
                    pred.next = new Node<K,V>(hash, key,
                                              value, null);
                    break;
                }
            }
        }
        else if (f instanceof TreeBin) {
            Node<K,V> p;
            binCount = 2;
            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                           value)) != null) {
                oldVal = p.val;
                if (!onlyIfAbsent)
                    p.val = value;
            }
        }
    }
}

1）插入之前，再次呼叫 tabAt(tab, i) == f 來判斷 f 是否被其他執行緒修改。

2）如果 fh（f 的雜湊值） >= 0，說明 f 是連結串列的頭節點，遍歷連結串列，找到對應的 Node，更新值，否則插入到末尾。

3）如果 f 是紅黑樹，則按照紅黑樹的方式插入或者更新節點。

分析完 put() 方法後，再來看 get() 方法：

public V get(Object key) {
    ConcurrentHashMap.Node<K,V>[] tab; ConcurrentHashMap.Node<K,V> e, p; int n, eh; K ek;
    int h = spread(key.hashCode());
    if ((tab = table) != null && (n = tab.length) > 0 &&
            (e = tabAt(tab, (n - 1) & h)) != null) {
        if ((eh = e.hash) == h) {
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                return e.val;
        }
        else if (eh < 0)
            return (p = e.find(h, key)) != null ? p.val : null;
        while ((e = e.next) != null) {
            if (e.hash == h &&
                    ((ek = e.key) == key || (ek != null && key.equals(ek))))
                return e.val;
        }
    }
    return null;
}

是不是簡單很多？

1）如果雜湊值相等（(eh = e.hash) == h），直接返回 table 陣列中的元素。

2）如果是紅黑樹（eh < 0），按照紅黑樹的方式 find 返回。

3）如果是連結串列，進行遍歷，然後根據 key 獲取 value。

最後，來寫一個 ConcurrentHashMap 的應用例項吧！

/**
 * @author 沉默王二，一枚有趣的程式設計師
 */
public class ConcurrentHashMapDemo {
    public final static int THREAD_POOL_SIZE = 5;

    public static void main(String[] args) throws InterruptedException {
        Map<String, String> map = new ConcurrentHashMap<>();

        long startTime = System.nanoTime();
        ExecutorService crunchifyExServer = Executors.newFixedThreadPool(THREAD_POOL_SIZE);
        for (int j = 0; j < THREAD_POOL_SIZE; j++) {
            crunchifyExServer.execute(new Runnable() {
                @SuppressWarnings("unused")
                @Override
                public void run() {
                    for (int i = 0; i < 500000; i++) {
                        map.put("itwanger"+i, "沉默王二");
                    }
                }
            });
        }

        crunchifyExServer.shutdown();
        crunchifyExServer.awaitTermination(Long.MAX_VALUE, TimeUnit.DAYS);

        long entTime = System.nanoTime();
        long totalTime = (entTime - startTime) / 1000000L;
        System.out.println(totalTime + "ms");
    }
}

給同學們留一道作業題，感興趣的話可以嘗試下，把 ConcurrentHashMap 換成 SynchronizedMap，比較一下兩者效能上的差異，差距還是挺明顯的。

我是沉默王二，一枚在九朝古都洛陽苟且偷生的程式設計師。關注即可提升學習效率，感謝你的三連支援，奧利給?。

注：如果文章有任何問題，歡迎毫不留情地指正。

如果你覺得文章對你有些幫助，歡迎微信搜尋「沉默王二」第一時間閱讀，回覆關鍵字「小白」可以免費獲取我肝了 4 萬+字的《Java 小白從入門到放肆》2.0 版；本文 GitHub github.com/itwanger 已收錄，歡迎 star。

Java7 ConcurrentHashMap原始碼淺析
2019-03-02
JavaHashMap原始碼
淺入淺出webpack
2019-03-04
Web
深入淺出Mybatis原始碼系列（一）---Mybatis入門
2018-09-18
MyBatis原始碼
深入淺出Java執行緒池：原始碼篇
2021-02-06
Java執行緒原始碼
深入淺出ReentrantReadWriteLock原始碼解析
2020-07-17
原始碼
深入淺出Semaphore原始碼解析
2020-07-18
原始碼
深入淺出ReentrantLock原始碼解析
2020-07-15
ReentrantLock原始碼
深入淺出AQS原始碼解析
2020-07-13
AQS原始碼
淺入淺出 MySQL 索引
2021-05-17
MySql索引
淺入淺出圖解domDIff
2019-03-04
圖解
『淺入淺出』MySQL 和 InnoDB
2019-01-25
MySql
Java 註解（Annotation）淺入深出
2018-12-05
Java
Es6 generator淺入淺出
2019-03-05
淺入淺出SQL Server 觸發器
2018-11-11
SQLServer觸發器
ConcurrentHashMap原始碼解析-Java7
2020-06-19
HashMap原始碼Java
Java併發：深入淺出AQS之獨佔鎖模式原始碼分析
2019-05-12
JavaAQS模式原始碼
Layui 原始碼淺讀（模組載入原理）
2021-03-01
UI原始碼
quicklink原始碼淺析
2018-12-19
UI原始碼
Koa 原始碼淺析
2018-09-16
原始碼
淺析Redux原始碼
2018-05-14
Redux原始碼
String原始碼淺析
2020-09-11
原始碼
webmagic原始碼淺析
2020-10-23
Web原始碼
Lifecycle原始碼淺析
2019-05-06
原始碼
Redux原始碼淺析
2019-02-11
Redux原始碼
ThreadLocal 原始碼淺析
2024-06-24
thread原始碼
redux 原始碼淺析
2021-05-31
Redux原始碼
深入淺出解讀 Spring 原始碼：IOC/AOP 篇
2018-04-12
Spring原始碼
Flutter 原始碼系列：DropdownButton 原始碼淺析
2019-07-03
Flutter原始碼
從淺入深瞭解Koa2原始碼
2022-04-11
原始碼
Spring淺入淺出——不吹牛逼不裝逼
2019-08-06
Spring
Java高階篇——深入淺出Java類載入機制
2018-05-03
Java
淺入深出Vue：路由
2019-07-08
Vue路由
淺入深出Vue：元件
2019-07-09
Vue元件
深入淺出java的Map
2020-12-15
Java
Redux原始碼全篇淺讀
2019-02-25
Redux原始碼
Paging Library原始碼淺析
2019-02-26
原始碼
String 原始碼淺析(一)
2019-01-19
原始碼
Discuz! Q 原始碼淺析
2020-07-21
原始碼

原始碼淺入淺出 Java ConcurrentHashMap

相關文章