ConcurrentHashMap的size方法是執行緒安全的嗎？

紀莫發表於2020-09-07

原文網址 : https://www.cnblogs.com/jimoer/p/13625368.html

前言

之前在面試的過程中有被問到，ConcurrentHashMap的size方法是執行緒安全的嗎？
這個問題，確實沒有答好。這次來根據原始碼來了解一下，具體是怎麼一個實現過程。

ConcurrentHashMap的原理與結構

我們都知道Hash表的結構是陣列加連結串列，就是一個陣列中，每一個元素都是一個連結串列，有時候也把會形象的把陣列中的每個元素稱為一個“桶”。在插入元素的時候，首先通過對傳入的鍵（key），進行一個雜湊函式的處理，來確定元素應該存放於陣列中哪個一個元素的連結串列中。
這種資料結構在很多計算機語言中都能找到其身影，在Java中如HashMap，ConcurrentHashMap等都是這種資料結構。

但是這中資料結構在實現HashMap的時候並不是執行緒安全的，因為在HashMap擴容的時候，是會將原先的連結串列遷移至新的連結串列陣列中，在遷移過程中多執行緒情況下會有造成連結串列的死迴圈情況（JDK1.7之前的頭插法）；還有就是在多執行緒插入的時候也會造成連結串列中資料的覆蓋導致資料丟失。

所以就出現了執行緒安全的HashMap類似的hash表集合，典型的就是HashTable和ConcurrentHashMap。
Hashtable實現執行緒安全的代價比較大，那就是在所有可能產生競爭方法裡都加上了synchronized，這樣就會導致，當出現競爭的時候只有一個執行緒能對整個Hashtable進行操作，其他所有執行緒都需要阻塞等待當前獲取到鎖的執行緒執行完成。
這樣效率是非常低的。

而ConcurrentHashMap解決執行緒安全的方式就不一樣了，它避免了對整個Map進行加鎖，從而提高了併發的效率。
下面將具體介紹一下JDK1.7和1.8的實現。

JDK1.7中的ConcurrentHashMap

JDK1.7中的ConcurrentHashMap採用了分段鎖的形式，每一段為一個Segment類，它內部類似HashMap的結構，內部有一個Entry陣列，陣列的每個元素是一個連結串列。同時Segment類繼承自ReentrantLock。
結構如下：
在這裡插入圖片描述
在HashEntry中採用了volatile來修飾了HashEntry的當前值和next元素的值。所以get方法在獲取資料的時候是不需要加鎖的，這樣就大大的提供了執行效率。
在執行put()方法的時候會先嚐試獲取鎖（tryLock()），如果獲取鎖失敗，說明存在競爭，那麼將通過scanAndLockForPut()方法執行自旋，當自旋次數達到MAX_SCAN_RETRIES時會執行阻塞鎖，直到獲取鎖成功。
原始碼如下：

static final int MAX_SCAN_RETRIES =
            Runtime.getRuntime().availableProcessors() > 1 ? 64 : 1;

final V put(K key, int hash, V value, boolean onlyIfAbsent) {
	// 首先嚐試獲取鎖，獲取失敗則執行自旋，自旋次數超過最大長度，後改為阻塞鎖，直到獲取鎖成功。
     HashEntry<K,V> node = tryLock() ? null :
         scanAndLockForPut(key, hash, value);
     V oldValue;
     try {
         HashEntry<K,V>[] tab = table;
         int index = (tab.length - 1) & hash;
         HashEntry<K,V> first = entryAt(tab, index);
         for (HashEntry<K,V> e = first;;) {
             if (e != null) {
                 K k;
                 if ((k = e.key) == key ||
                     (e.hash == hash && key.equals(k))) {
                     oldValue = e.value;
                     if (!onlyIfAbsent) {
                         e.value = value;
                         ++modCount;
                     }
                     break;
                 }
                 e = e.next;
             }
             else {
                 if (node != null)
                     node.setNext(first);
                 else
                     node = new HashEntry<K,V>(hash, key, value, first);
                 int c = count + 1;
                 if (c > threshold && tab.length < MAXIMUM_CAPACITY)
                     rehash(node);
                 else
                     setEntryAt(tab, index, node);
                 ++modCount;
                 count = c;
                 oldValue = null;
                 break;
             }
         }
     } finally {
         unlock();
     }
     return oldValue;
 }

JDK1.8後的ConcurrentHashMap

在JDK1.8中，放棄了Segment這種分段鎖的形式，而是採用了CAS+Synchronized的方式來保證併發操作的，採用了和HashMap一樣的結構，直接用陣列加連結串列，在連結串列長度大於8的時候為了提高查詢效率會將連結串列轉為紅黑樹（連結串列定位資料的時間複雜度為O(N)，紅黑樹定位資料的時間複雜度為O(logN)）。
在程式碼上也和JDK1.8的HashMap很像，也是將原先的HashEntry改為了Node類，但還是使用了volatile修飾了當前值和next的值。從而保證了在獲取資料時候的高效。
JDK1.8中的ConcurrentHashMap在執行put()方法的時候還是有些複雜的，主要是為了保證執行緒安全才做了一系列的措施。
原始碼如下：
在這裡插入圖片描述

第一步通過key進行hash。
第二步判斷是否需要初始化資料結構。
第三步根據key定位到當前Node，如果當前位置為空，則可以寫入資料，利用CAS機制嘗試寫入資料，如果寫入失敗，說明存在競爭，將會通過自旋來保證成功。
第四步如果當前的hashcode值等於MOVED則需要進行擴容（擴容時也使用了CAS來保證了執行緒安全）。
第五步如果上面四步都不滿足，那麼則通過synchronized阻塞鎖將資料寫入。
第六步如果資料量大於TREEIFY_THRESHOLD時需要轉換成紅黑樹（預設為8）。

JDK1.8的ConcurrentHashMap的get()方法就還是比較簡單：

根據key的hashcode定址到具體的桶上。
如果是紅黑樹則按照紅黑樹的方式去查詢資料。
如果是連結串列就按照遍歷連結串列的方式去查詢資料。

public V get(Object key) {
     Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
     int h = spread(key.hashCode());
     if ((tab = table) != null && (n = tab.length) > 0 &&
         (e = tabAt(tab, (n - 1) & h)) != null) {
         if ((eh = e.hash) == h) {
             if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                 return e.val;
         }
         else if (eh < 0)
             return (p = e.find(h, key)) != null ? p.val : null;
         while ((e = e.next) != null) {
             if (e.hash == h &&
                 ((ek = e.key) == key || (ek != null && key.equals(ek))))
                 return e.val;
         }
     }
     return null;
 }

ConcurrentHashMap的size方法

JDK1.7中的ConcurrentHashMap的size方法，計算size的時候會先不加鎖獲取一次資料長度，然後再獲取一次，最多三次。比較前後兩次的值，如果相同的話說明不存在競爭的編輯操作，就直接把值返回就可以了。
但是如果前後獲取的值不一樣，那麼會將每個Segment都加上鎖，然後計算ConcurrentHashMap的size值。
在這裡插入圖片描述
JDK1.8中的ConcurrentHashMap的size()方法的原始碼如下：

/**
 * {@inheritDoc}
 */
public int size() {
    long n = sumCount();
    return ((n < 0L) ? 0 :
            (n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE :
            (int)n);
}

這個方法最大會返回int的最大值，但是ConcurrentHashMap的長度有可能超過int的最大值。
在JDK1.8中增加了mappingCount()方法，這個方法的返回值是long型別的，所以JDK1.8以後更推薦用這個方法獲取Map中資料的數量。

/**
 * @return the number of mappings
 * @since 1.8
 */
 public long mappingCount() {
     long n = sumCount();
     return (n < 0L) ? 0L : n; // ignore transient negative values
 }

無論是size()方法還是mappingCount()方法，核心方法都是sumCount()方法。
原始碼如下：

final long sumCount() {
     CounterCell[] as = counterCells; CounterCell a;
     long sum = baseCount;
     if (as != null) {
         for (int i = 0; i < as.length; ++i) {
             if ((a = as[i]) != null)
                 sum += a.value;
         }
     }
     return sum;
 }

在上面sumCount()方法中我們看到，當counterCells為空時直接返回baseCount，當counterCells不為空時遍歷它並壘加到baseCount中。
先看baseCount

/**
 * Base counter value, used mainly when there is no contention,
 * but also as a fallback during table initialization
 * races. Updated via CAS.
 */
private transient volatile long baseCount;

baseCount是一個volatile變數，那麼我們來看在put()方法執行時是如何使用baseCount的，在put方法的最後一段程式碼中會呼叫addCount()方法，而addCount()方法的原始碼如下：
在這裡插入圖片描述
首先對baseCount做CAS自增操作。
如果併發導致了baseCount的CAS失敗了，則使用counterCells進行CAS。
如果counterCells的CAS也失敗了，那麼則進入fullAddCount()方法，fullAddCount()方法中會進入死迴圈，直到成功為止。
在這裡插入圖片描述
那麼CountCell到底是個什麼呢？
原始碼如下：

/**
 * A padded cell for distributing counts.  Adapted from LongAdder
 * and Striped64.  See their internal docs for explanation.
 */
@sun.misc.Contended static final class CounterCell {
    volatile long value;
    CounterCell(long x) { value = x; }
}

一個使用了 @sun.misc.Contended 標記的類，內部一個 volatile 變數。
@sun.misc.Contended 這個註解是為了防止“偽共享”。
那麼什麼是偽共享呢？

快取系統中是以快取行（cache line）為單位儲存的。快取行是2的整數冪個連續位元組，一般為32-256個位元組。最常見的快取行大小是64個位元組。當多執行緒修改互相獨立的變數時，如果這些變數共享同一個快取行，就會無意中影響彼此的效能，這就是偽共享。

所以偽共享對效能危害極大。
JDK 8 版本之前沒有這個註解，JDK1.8之後使用拼接來解決這個問題，把快取行加滿，讓快取之間的修改互不影響。

總結

無論是JDK1.7還是JDK1.8中，ConcurrentHashMap的size()方法都是執行緒安全的，都是準確的計算出實際的數量，但是這個資料在併發場景下是隨時都在變的。

ConcurrentHashMap執行緒安全嗎?
2020-12-27
HashMap執行緒
【Java】ConcurrentHashMap執行緒安全技巧
2020-12-08
JavaHashMap執行緒
ConcurrentHashMap一定執行緒安全？
2019-04-19
HashMap執行緒
解讀Java8中ConcurrentHashMap是如何保證執行緒安全的
2019-04-06
JavaHashMap執行緒
你的單例模式真的是執行緒安全的嗎?
2018-10-10
單例模式執行緒
從原始碼分析ConcurrentHashMap執行緒安全和高效的特性
2020-12-05
原始碼HashMap執行緒
ConcurrentHashMap執行緒安全機制以及原始碼分析
2020-10-24
HashMap執行緒原始碼
靜態變數在多執行緒環境下的初始化是執行緒安全的嗎？
2024-11-09
變數執行緒
String中hashCode方法的執行緒安全
2018-08-12
執行緒
面試官：Context攜帶資料是執行緒安全的嗎？
2022-02-11
面試Context執行緒
什麼是執行緒安全和執行緒不安全
2018-07-22
執行緒
模板方法中的執行緒安全問題
2023-05-05
執行緒
面試阿里當場傻眼，被P8質問:ConcurrentHashMap真的執行緒安全嗎？
2020-12-18
面試阿里HashMap執行緒
【Java多執行緒】執行緒安全的集合
2020-10-18
Java執行緒
[Java併發]Concurrenthashmap的size()
2024-09-10
JavaHashMap
多執行緒(五)---執行緒的Yield方法
2020-10-31
執行緒
HashMap為何執行緒不安全？HashMap，HashTable，ConcurrentHashMap對比
2022-11-30
HashMap執行緒
執行緒、開啟執行緒的兩種方式、執行緒下的Join方法、守護執行緒
2024-06-25
執行緒
執行緒池中多餘的執行緒是如何回收的？
2020-10-31
執行緒
為什麼 Random.Shared 是執行緒安全的
2022-12-12
random執行緒
24. 一個普通main方法的執行，是單執行緒模式還是多執行緒模式？為什麼？
2020-12-09
AI執行緒模式
建立執行緒的4種方法 and 執行緒的生命週期
2021-10-16
執行緒
ConcurrentHashMap原始碼解析，多執行緒擴容
2020-10-12
HashMap原始碼執行緒
Java面試題：SimpleDateFormat是執行緒安全的嗎？使用時應該注意什麼？
2024-04-26
Java面試題ORM執行緒
一道非常棘手的常見Java 面試題：i++ 是執行緒安全的嗎？
2020-12-13
Java面試題執行緒
執行緒安全
2020-10-03
執行緒
多執行緒核心技術（1）-執行緒的基本方法
2019-04-13
執行緒
多執行緒系列之執行緒安全
2019-01-09
執行緒
iOS 多執行緒之執行緒安全
2019-01-24
iOS執行緒
Java執行緒(一)：執行緒安全與不安全
2021-12-05
Java執行緒
ArrayList 的執行緒安全問題
2024-01-05
執行緒
保障執行緒安全的設計
2022-05-07
執行緒
什麼時候執行緒不安全？怎樣做到執行緒安全？怎麼擴充套件執行緒安全的類？
2018-09-15
執行緒套件
SimpleDateFormat一定是執行緒不安全嗎？
2021-04-21
ORM執行緒
併發程式設計 —— ConcurrentHashMap size 方法原理分析
2019-03-04
程式設計HashMap
【多執行緒總結(二)－執行緒安全與執行緒同步】
2018-09-09
執行緒
java執行緒執行緒休眠，sleep方法
2020-11-23
Java執行緒
Java中實現執行緒安全HashSet的幾種方法 | baeldung
2022-01-27
Java執行緒

ConcurrentHashMap的size方法是執行緒安全的嗎？

前言

ConcurrentHashMap的原理與結構

JDK1.7中的ConcurrentHashMap

JDK1.8後的ConcurrentHashMap

ConcurrentHashMap的size方法

總結

相關文章