還不懂 ConcurrentHashMap ？這份原始碼分析瞭解一下

文章已經收錄在 Github.com/niumoo/JavaNotes ，更有 Java 程式設計師所需要掌握的核心知識，歡迎Star和指教。
歡迎關注我的公眾號，文章每週更新。

上一篇文章介紹了 HashMap 原始碼，反響不錯，也有很多同學發表了自己的觀點，這次又來了，這次是 ConcurrentHashMap 了，作為執行緒安全的HashMap ，它的使用頻率也是很高。那麼它的儲存結構和實現原理是怎麼樣的呢？

1. ConcurrentHashMap 1.7

1. 儲存結構

Java 7 ConcurrentHashMap 儲存結構

Java 7 中 ConcurrentHashMap 的儲存結構如上圖，ConcurrnetHashMap 由很多個 Segment 組合，而每一個 Segment 是一個類似於 HashMap 的結構，所以每一個 HashMap 的內部可以進行擴容。但是 Segment 的個數一旦初始化就不能改變，預設 Segment 的個數是 16 個，你也可以認為 ConcurrentHashMap 預設支援最多 16 個執行緒併發。

2. 初始化

通過 ConcurrentHashMap 的無參構造探尋 ConcurrentHashMap 的初始化流程。

    /**
     * Creates a new, empty map with a default initial capacity (16),
     * load factor (0.75) and concurrencyLevel (16).
     */
    public ConcurrentHashMap() {
        this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR, DEFAULT_CONCURRENCY_LEVEL);
    }

無參構造中呼叫了有參構造，傳入了三個引數的預設值，他們的值是。

    /**
     * 預設初始化容量
     */
    static final int DEFAULT_INITIAL_CAPACITY = 16;

    /**
     * 預設負載因子
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    /**
     * 預設併發級別
     */
    static final int DEFAULT_CONCURRENCY_LEVEL = 16;

接著看下這個有參建構函式的內部實現邏輯。

@SuppressWarnings("unchecked")
public ConcurrentHashMap(int initialCapacity,float loadFactor, int concurrencyLevel) {
    // 引數校驗
    if (!(loadFactor > 0) || initialCapacity < 0 || concurrencyLevel <= 0)
        throw new IllegalArgumentException();
    // 校驗併發級別大小，大於 1<<16，重置為 65536
    if (concurrencyLevel > MAX_SEGMENTS)
        concurrencyLevel = MAX_SEGMENTS;
    // Find power-of-two sizes best matching arguments
    // 2的多少次方
    int sshift = 0;
    int ssize = 1;
    // 這個迴圈可以找到 concurrencyLevel 之上最近的 2的次方值
    while (ssize < concurrencyLevel) {
        ++sshift;
        ssize <<= 1;
    }
    // 記錄段偏移量
    this.segmentShift = 32 - sshift;
    // 記錄段掩碼
    this.segmentMask = ssize - 1;
    // 設定容量
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    // c = 容量 / ssize ，預設 16 / 16 = 1，這裡是計算每個 Segment 中的類似於 HashMap 的容量
    int c = initialCapacity / ssize;
    if (c * ssize < initialCapacity)
        ++c;
    int cap = MIN_SEGMENT_TABLE_CAPACITY;
    //Segment 中的類似於 HashMap 的容量至少是2或者2的倍數
    while (cap < c)
        cap <<= 1;
    // create segments and segments[0]
    // 建立 Segment 陣列，設定 segments[0]
    Segment<K,V> s0 = new Segment<K,V>(loadFactor, (int)(cap * loadFactor),
                         (HashEntry<K,V>[])new HashEntry[cap]);
    Segment<K,V>[] ss = (Segment<K,V>[])new Segment[ssize];
    UNSAFE.putOrderedObject(ss, SBASE, s0); // ordered write of segments[0]
    this.segments = ss;
}

總結一下在 Java 7 中 ConcurrnetHashMap 的初始化邏輯。

必要引數校驗。
校驗併發級別 concurrencyLevel 大小，如果大於最大值，重置為最大值。無慘構造預設值是 16.
尋找併發級別 concurrencyLevel 之上最近的 2 的冪次方值，作為初始化容量大小，預設是 16。
記錄 segmentShift 偏移量，這個值為【容量 = 2 的N次方】中的 N，在後面 Put 時計算位置時會用到。預設是 32 - sshift = 28.
記錄 segmentMask，預設是 ssize - 1 = 16 -1 = 15.
初始化 segments[0]，預設大小為 2，負載因子 0.75，擴容閥值是 2*0.75=1.5，插入第二個值時才會進行擴容。

3. put

接著上面的初始化引數繼續檢視 put 方法原始碼。

/**
 * Maps the specified key to the specified value in this table.
 * Neither the key nor the value can be null.
 *
 * <p> The value can be retrieved by calling the <tt>get</tt> method
 * with a key that is equal to the original key.
 *
 * @param key key with which the specified value is to be associated
 * @param value value to be associated with the specified key
 * @return the previous value associated with <tt>key</tt>, or
 *         <tt>null</tt> if there was no mapping for <tt>key</tt>
 * @throws NullPointerException if the specified key or value is null
 */
public V put(K key, V value) {
    Segment<K,V> s;
    if (value == null)
        throw new NullPointerException();
    int hash = hash(key);
    // hash 值無符號右移 28位（初始化時獲得），然後與 segmentMask=15 做與運算
    // 其實也就是把高4位與segmentMask（1111）做與運算
    int j = (hash >>> segmentShift) & segmentMask;
    if ((s = (Segment<K,V>)UNSAFE.getObject          // nonvolatile; recheck
         (segments, (j << SSHIFT) + SBASE)) == null) //  in ensureSegment
        // 如果查詢到的 Segment 為空，初始化
        s = ensureSegment(j);
    return s.put(key, hash, value, false);
}

/**
 * Returns the segment for the given index, creating it and
 * recording in segment table (via CAS) if not already present.
 *
 * @param k the index
 * @return the segment
 */
@SuppressWarnings("unchecked")
private Segment<K,V> ensureSegment(int k) {
    final Segment<K,V>[] ss = this.segments;
    long u = (k << SSHIFT) + SBASE; // raw offset
    Segment<K,V> seg;
    // 判斷 u 位置的 Segment 是否為null
    if ((seg = (Segment<K,V>)UNSAFE.getObjectVolatile(ss, u)) == null) {
        Segment<K,V> proto = ss[0]; // use segment 0 as prototype
        // 獲取0號 segment 裡的 HashEntry<K,V> 初始化長度
        int cap = proto.table.length;
        // 獲取0號 segment 裡的 hash 表裡的擴容負載因子，所有的 segment 的 loadFactor 是相同的
        float lf = proto.loadFactor;
        // 計算擴容閥值
        int threshold = (int)(cap * lf);
        // 建立一個 cap 容量的 HashEntry 陣列
        HashEntry<K,V>[] tab = (HashEntry<K,V>[])new HashEntry[cap];
        if ((seg = (Segment<K,V>)UNSAFE.getObjectVolatile(ss, u)) == null) { // recheck
            // 再次檢查 u 位置的 Segment 是否為null，因為這時可能有其他執行緒進行了操作
            Segment<K,V> s = new Segment<K,V>(lf, threshold, tab);
            // 自旋檢查 u 位置的 Segment 是否為null
            while ((seg = (Segment<K,V>)UNSAFE.getObjectVolatile(ss, u))
                   == null) {
                // 使用CAS 賦值，只會成功一次
                if (UNSAFE.compareAndSwapObject(ss, u, null, seg = s))
                    break;
            }
        }
    }
    return seg;
}

上面的原始碼分析了 ConcurrentHashMap 在 put 一個資料時的處理流程，下面梳理下具體流程。

計算要 put 的 key 的位置，獲取指定位置的 Segment。
如果指定位置的 Segment 為空，則初始化這個 Segment.

初始化 Segment 流程：
1. 檢查計算得到的位置的 Segment 是否為null.
2. 為 null 繼續初始化，使用 Segment[0] 的容量和負載因子建立一個 HashEntry 陣列。
3. 再次檢查計算得到的指定位置的 Segment 是否為null.
4. 使用建立的 HashEntry 陣列初始化這個 Segment.
5. 自旋判斷計算得到的指定位置的 Segment 是否為null，使用 CAS 在這個位置賦值為 Segment.
Segment.put 插入 key,value 值。

上面探究了獲取 Segment 段和初始化 Segment 段的操作。最後一行的 Segment 的 put 方法還沒有檢視，繼續分析。

final V put(K key, int hash, V value, boolean onlyIfAbsent) {
    // 獲取 ReentrantLock 獨佔鎖，獲取不到，scanAndLockForPut 獲取。
    HashEntry<K,V> node = tryLock() ? null : scanAndLockForPut(key, hash, value);
    V oldValue;
    try {
        HashEntry<K,V>[] tab = table;
        // 計算要put的資料位置
        int index = (tab.length - 1) & hash;
        // CAS 獲取 index 座標的值
        HashEntry<K,V> first = entryAt(tab, index);
        for (HashEntry<K,V> e = first;;) {
            if (e != null) {
                // 檢查是否 key 已經存在，如果存在，則遍歷連結串列尋找位置，找到後替換 value
                K k;
                if ((k = e.key) == key ||
                    (e.hash == hash && key.equals(k))) {
                    oldValue = e.value;
                    if (!onlyIfAbsent) {
                        e.value = value;
                        ++modCount;
                    }
                    break;
                }
                e = e.next;
            }
            else {
                // first 有值沒說明 index 位置已經有值了，有衝突，連結串列頭插法。
                if (node != null)
                    node.setNext(first);
                else
                    node = new HashEntry<K,V>(hash, key, value, first);
                int c = count + 1;
                // 容量大於擴容閥值，小於最大容量，進行擴容
                if (c > threshold && tab.length < MAXIMUM_CAPACITY)
                    rehash(node);
                else
                    // index 位置賦值 node，node 可能是一個元素，也可能是一個連結串列的表頭
                    setEntryAt(tab, index, node);
                ++modCount;
                count = c;
                oldValue = null;
                break;
            }
        }
    } finally {
        unlock();
    }
    return oldValue;
}

由於 Segment 繼承了 ReentrantLock，所以 Segment 內部可以很方便的獲取鎖，put 流程就用到了這個功能。

tryLock() 獲取鎖，獲取不到使用 scanAndLockForPut 方法繼續獲取。
計算 put 的資料要放入的 index 位置，然後獲取這個位置上的 HashEntry 。
遍歷 put 新元素，為什麼要遍歷？因為這裡獲取的 HashEntry 可能是一個空元素，也可能是連結串列已存在，所以要區別對待。

如果這個位置上的 HashEntry 不存在：
1. 如果當前容量大於擴容閥值，小於最大容量，進行擴容。
2. 直接頭插法插入。

如果這個位置上的 HashEntry 存在：

判斷連結串列當前元素 Key 和 hash 值是否和要 put 的 key 和 hash 值一致。一致則替換值
不一致，獲取連結串列下一個節點，直到發現相同進行值替換，或者連結串列表裡完畢沒有相同的。
1. 如果當前容量大於擴容閥值，小於最大容量，進行擴容。
2. 直接連結串列頭插法插入。

如果要插入的位置之前已經存在，替換後返回舊值，否則返回 null.

這裡面的第一步中的 scanAndLockForPut 操作這裡沒有介紹，這個方法做的操作就是不斷的自旋 tryLock() 獲取鎖。當自旋次數大於指定次數時，使用 lock() 阻塞獲取鎖。在自旋時順表獲取下 hash 位置的 HashEntry。

private HashEntry<K,V> scanAndLockForPut(K key, int hash, V value) {
    HashEntry<K,V> first = entryForHash(this, hash);
    HashEntry<K,V> e = first;
    HashEntry<K,V> node = null;
    int retries = -1; // negative while locating node
    // 自旋獲取鎖
    while (!tryLock()) {
        HashEntry<K,V> f; // to recheck first below
        if (retries < 0) {
            if (e == null) {
                if (node == null) // speculatively create node
                    node = new HashEntry<K,V>(hash, key, value, null);
                retries = 0;
            }
            else if (key.equals(e.key))
                retries = 0;
            else
                e = e.next;
        }
        else if (++retries > MAX_SCAN_RETRIES) {
            // 自旋達到指定次數後，阻塞等到只到獲取到鎖
            lock();
            break;
        }
        else if ((retries & 1) == 0 &&
                 (f = entryForHash(this, hash)) != first) {
            e = first = f; // re-traverse if entry changed
            retries = -1;
        }
    }
    return node;
}

4. 擴容 rehash

ConcurrentHashMap 的擴容只會擴容到原來的兩倍。老陣列裡的資料移動到新的陣列時，位置要麼不變，要麼變為 index+ oldSize，引數裡的 node 會在擴容之後使用連結串列頭插法插入到指定位置。

private void rehash(HashEntry<K,V> node) {
    HashEntry<K,V>[] oldTable = table;
    // 老容量
    int oldCapacity = oldTable.length;
    // 新容量，擴大兩倍
    int newCapacity = oldCapacity << 1;
    // 新的擴容閥值 
    threshold = (int)(newCapacity * loadFactor);
    // 建立新的陣列
    HashEntry<K,V>[] newTable = (HashEntry<K,V>[]) new HashEntry[newCapacity];
    // 新的掩碼，預設2擴容後是4，-1是3，二進位制就是11。
    int sizeMask = newCapacity - 1;
    for (int i = 0; i < oldCapacity ; i++) {
        // 遍歷老陣列
        HashEntry<K,V> e = oldTable[i];
        if (e != null) {
            HashEntry<K,V> next = e.next;
            // 計算新的位置，新的位置只可能是不便或者是老的位置+老的容量。
            int idx = e.hash & sizeMask;
            if (next == null)   //  Single node on list
                // 如果當前位置還不是連結串列，只是一個元素，直接賦值
                newTable[idx] = e;
            else { // Reuse consecutive sequence at same slot
                // 如果是連結串列了
                HashEntry<K,V> lastRun = e;
                int lastIdx = idx;
                // 新的位置只可能是不便或者是老的位置+老的容量。
                // 遍歷結束後，lastRun 後面的元素位置都是相同的
                for (HashEntry<K,V> last = next; last != null; last = last.next) {
                    int k = last.hash & sizeMask;
                    if (k != lastIdx) {
                        lastIdx = k;
                        lastRun = last;
                    }
                }
                // ，lastRun 後面的元素位置都是相同的，直接作為連結串列賦值到新位置。
                newTable[lastIdx] = lastRun;
                // Clone remaining nodes
                for (HashEntry<K,V> p = e; p != lastRun; p = p.next) {
                    // 遍歷剩餘元素，頭插法到指定 k 位置。
                    V v = p.value;
                    int h = p.hash;
                    int k = h & sizeMask;
                    HashEntry<K,V> n = newTable[k];
                    newTable[k] = new HashEntry<K,V>(h, p.key, v, n);
                }
            }
        }
    }
    // 頭插法插入新的節點
    int nodeIndex = node.hash & sizeMask; // add the new node
    node.setNext(newTable[nodeIndex]);
    newTable[nodeIndex] = node;
    table = newTable;
}

有些同學可能會對最後的兩個 for 迴圈有疑惑，這裡第一個 for 是為了尋找這樣一個節點，這個節點後面的所有 next 節點的新位置都是相同的。然後把這個作為一個連結串列賦值到新位置。第二個 for 迴圈是為了把剩餘的元素通過頭插法插入到指定位置連結串列。這樣實現的原因可能是基於概率統計，有深入研究的同學可以發表下意見。

5. get

到這裡就很簡單了，get 方法只需要兩步即可。

計算得到 key 的存放位置。
遍歷指定位置查詢相同 key 的 value 值。

public V get(Object key) {
    Segment<K,V> s; // manually integrate access methods to reduce overhead
    HashEntry<K,V>[] tab;
    int h = hash(key);
    long u = (((h >>> segmentShift) & segmentMask) << SSHIFT) + SBASE;
    // 計算得到 key 的存放位置
    if ((s = (Segment<K,V>)UNSAFE.getObjectVolatile(segments, u)) != null &&
        (tab = s.table) != null) {
        for (HashEntry<K,V> e = (HashEntry<K,V>) UNSAFE.getObjectVolatile
                 (tab, ((long)(((tab.length - 1) & h)) << TSHIFT) + TBASE);
             e != null; e = e.next) {
            // 如果是連結串列，遍歷查詢到相同 key 的 value。
            K k;
            if ((k = e.key) == key || (e.hash == h && key.equals(k)))
                return e.value;
        }
    }
    return null;
}

2. ConcurrentHashMap 1.8

1. 儲存結構

Java8 ConcurrentHashMap 儲存結構（圖片來自 javadoop）

可以發現 Java8 的 ConcurrentHashMap 相對於 Java7 來說變化比較大，不再是之前的 Segment 陣列 + HashEntry 陣列 + 連結串列，而是 Node 陣列 + 連結串列 / 紅黑樹。當衝突連結串列達到一定長度時，連結串列會轉換成紅黑樹。

2. 初始化 initTable

/**
 * Initializes table, using the size recorded in sizeCtl.
 */
private final Node<K,V>[] initTable() {
    Node<K,V>[] tab; int sc;
    while ((tab = table) == null || tab.length == 0) {
        ／／　如果 sizeCtl < 0 ,說明另外的執行緒執行CAS 成功，正在進行初始化。
        if ((sc = sizeCtl) < 0)
            // 讓出 CPU 使用權
            Thread.yield(); // lost initialization race; just spin
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
            try {
                if ((tab = table) == null || tab.length == 0) {
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    @SuppressWarnings("unchecked")
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    table = tab = nt;
                    sc = n - (n >>> 2);
                }
            } finally {
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

從原始碼中可以發現 ConcurrentHashMap 的初始化是通過自旋和 CAS 操作完成的。裡面需要注意的是變數 sizeCtl ，它的值決定著當前的初始化狀態。

-1 說明正在初始化
-N 說明有N-1個執行緒正在進行擴容
表示 table 初始化大小，如果 table 沒有初始化
表示 table 容量，如果 table　已經初始化。

3. put

直接過一遍 put 原始碼。

public V put(K key, V value) {
    return putVal(key, value, false);
}

/** Implementation for put and putIfAbsent */
final V putVal(K key, V value, boolean onlyIfAbsent) {
    // key 和 value 不能為空
    if (key == null || value == null) throw new NullPointerException();
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        // f = 目標位置元素
        Node<K,V> f; int n, i, fh;// fh 後面存放目標位置的元素 hash 值
        if (tab == null || (n = tab.length) == 0)
            // 陣列桶為空，初始化陣列桶（自旋+CAS)
            tab = initTable();
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            // 桶內為空，CAS 放入，不加鎖，成功了就直接 break 跳出
            if (casTabAt(tab, i, null,new Node<K,V>(hash, key, value, null)))
                break;  // no lock when adding to empty bin
        }
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        else {
            V oldVal = null;
            // 使用 synchronized 加鎖加入節點
            synchronized (f) {
                if (tabAt(tab, i) == f) {
                    // 說明是連結串列
                    if (fh >= 0) {
                        binCount = 1;
                        // 迴圈加入新的或者覆蓋節點
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    else if (f instanceof TreeBin) {
                        // 紅黑樹
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                       value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            if (binCount != 0) {
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    addCount(1L, binCount);
    return null;
}

根據 key 計算出 hashcode 。
判斷是否需要進行初始化。
即為當前 key 定位出的 Node，如果為空表示當前位置可以寫入資料，利用 CAS 嘗試寫入，失敗則自旋保證成功。
如果當前位置的 hashcode == MOVED == -1,則需要進行擴容。
如果都不滿足，則利用 synchronized 鎖寫入資料。
如果數量大於 TREEIFY_THRESHOLD 則要轉換為紅黑樹。

4. get

get 流程比較簡單，直接過一遍原始碼。

public V get(Object key) {
    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
    // key 所在的 hash 位置
    int h = spread(key.hashCode());
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        // 如果指定位置元素存在，頭結點hash值相同
        if ((eh = e.hash) == h) {
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                // key hash 值相等，key值相同，直接返回元素 value
                return e.val;
        }
        else if (eh < 0)
            // 頭結點hash值小於0，說明正在擴容或者是紅黑樹，find查詢
            return (p = e.find(h, key)) != null ? p.val : null;
        while ((e = e.next) != null) {
            // 是連結串列，遍歷查詢
            if (e.hash == h &&
                ((ek = e.key) == key || (ek != null && key.equals(ek))))
                return e.val;
        }
    }
    return null;
}

總結一下 get 過程：

根據 hash 值計算位置。
查詢到指定位置，如果頭節點就是要找的，直接返回它的 value.
如果頭節點 hash 值小於 0 ，說明正在擴容或者是紅黑樹，查詢之。
如果是連結串列，遍歷查詢之。

總結：

總的來說 ConcruuentHashMap 在 Java8 中相對於 Java7 來說變化還是挺大的，

3. 總結

Java7 中 ConcruuentHashMap 使用的分段鎖，也就是每一個 Segment 上同時只有一個執行緒可以操作，每一個 Segment 都是一個類似 HashMap 陣列的結構，它可以擴容，它的衝突會轉化為連結串列。但是 Segment 的個數一但初始化就不能改變。

Java8 中的 ConcruuentHashMap 使用的 Synchronized 鎖加 CAS 的機制。結構也由 Java7 中的 Segment 陣列 + HashEntry 陣列 + 連結串列 進化成了 Node 陣列 + 連結串列 / 紅黑樹，Node 是類似於一個 HashEntry 的結構。它的衝突再達到一定大小時會轉化成紅黑樹，在衝突小於一定數量時又退回連結串列。

有些同學可能對 Synchronized 的效能存在疑問，其實 Synchronized 鎖自從引入鎖升級策略後，效能不再是問題，有興趣的同學可以自己瞭解下 Synchronized 的鎖升級。

最後的話

文章已經收錄在 Github.com/niumoo/JavaNotes ，歡迎Star和指教。更有一線大廠面試點，Java程式設計師需要掌握的核心知識等文章，也整理了很多我的文字，歡迎 Star 和完善，希望我們一起變得優秀。

文章有幫助可以點個「贊」或「分享」，都是支援，我都喜歡！
文章每週持續更新，要實時關注我更新的文章以及分享的乾貨，可以關注「未讀程式碼」公眾號

還不懂 ConcurrentHashMap ？這份原始碼分析瞭解一下

1. ConcurrentHashMap 1.7

1. 儲存結構

2. 初始化

3. put

4. 擴容 rehash

5. get

2. ConcurrentHashMap 1.8

1. 儲存結構

2. 初始化 initTable

3. put

4. get

3. 總結

相關文章