多執行緒知識梳理(7) ConcurrentHashMap 實現原理

澤毛發表於2017-12-21

執行緒HashMap

一、前言

ConcurrentHashMap是執行緒安全並且高效的HashMap，其它的類似容器有以下缺點：

HashMap在併發執行put操作時，會導致Entry連結串列形成環形資料結構，就會產生死迴圈獲取Entry。
HashTable使用synchronized來保證執行緒安全，但線上程競爭激烈的情況下HashTable的效率非常低下。

ConcurrentHashMap高效的原因在於它採用 鎖分段技術，首先將資料分成一段一段地儲存，然後給每段資料配一把鎖，當一個執行緒佔用鎖並且訪問一段資料的時候，其他段的資料也能被其他執行緒訪問。

二、 ConcurrentHashMap 的結構

ConcurrentHashMap是由Segment陣列結構和HashEntry陣列結構組成：

Segment是一種可重入鎖，在ConcurrentHashMap裡面扮演鎖的角色。
HashEntry則用於儲存鍵值對資料。

一個ConcurrentHashMap裡包含一個Segment陣列，它的結構和HashMap類似，是一種陣列和連結串列結構。

一個Segment裡包含一個HashEntry陣列，每個HashEntry是一個連結串列結構的元素，每個Segment守護著一個HashEntry裡的元素，當對HashEntry陣列的資料進行修改時，必須首先獲得與它對應的Segment鎖。

Segment 結構

static final class Segment<K,V> extends ReentrantLock implements Serializable {
    transient volatile int count;
    transient int modCount;
    transient int threshold;
    transient volatile HashEntry<K,V>[] table;
    final float loadFactor;
}
複製程式碼

count：Segment中元素的數量
modCount：對table的大小造成影響的操作的數量
threshold：閾值，Segment裡面元素的數量超過這個值依舊就會對Segment進行擴容
table：連結串列陣列，陣列中的每一個元素代表了一個連結串列的頭部
loadFactor：負載因子，用於確定threshold

HashEntry 結構

static final class HashEntry<K,V> {
    final K key;
    final int hash;
    volatile V value;
    final HashEntry<K,V> next;
}
複製程式碼

2.1 初始化

ConcurrentHashMap的初始化方法是通過initialCapacity、loadFactor和concurrencyLevel等幾個引數來初始化segment陣列、段偏移量segmentShift、段掩碼segmentMask和每個segment裡的HashEntry來實現的。

2.1.1 初始化 segment 陣列

初始化segment的原始碼如下，它會計算出：

ssize：segment陣列的長度
segmentShift：sshift等於ssize從1向左移位的次數，segmentShift等於32-sshift，segmentShift用於 定位參與雜湊運算的位數
segmentMask：雜湊運算的掩碼，等於ssize-1

if (concurrencyLevel > MAX_SEGMENTS)
    concurrencyLevel = MAX_SEGMENTS;
int sshift = 0;
int ssize = 1;
//計算 segments 陣列的長度，它是大於等於 concurrencyLevel 的最小的 2 的 N 次方。
while (ssize < concurrencyLevel) {
    ++sshift;
    ssize <<= 1;
}
segmentShift = 32 - sshift;
segmentMask = ssize - 1;
this.segments = Segment.newArray(ssize);
複製程式碼

2.1.2 初始化每個 segment

輸入引數initialCapacity是ConcurrentHashMap的初始化容量，loadFactor是每個segment的負載因子，在構造方法裡通過這兩個引數來初始化陣列中的每個segment。

if (initialCapacity < MAXIMUM_CAPACITY) {
    initialCapacity = MAXIMUM_CAPACITY;
}
int c = initialCapacity / ssize;
if (c * ssize < initialCapacity) {
    ++c;
}
int cap = 1;
while (cap < c) {
    cap <<= 1;
}
for (int i = 0; i < this.segments.length; i++) {
    this.segments[i] = new Segment<K, V>(cap, loadFactor);
}
複製程式碼

cap 是 segment 裡 HashEntry 陣列的長度，它等於initialCapacity / ssize，如果c大於1，就會取大於等於c的2的N次方。segment的容量threshold等於(int) cap * loadFactor，預設情況下initialCapacity等於16，ssize等於16，loadFactor等於0.75，因此cap等於1，threshold等於0。

2.2 定位 segment

在插入和獲取元素的時候，必須先通過雜湊演算法定位到Segment，ConcurrentHashMap會首先對元素的hashCode()進行一次再雜湊。

private static int hash(int h) {
    h += (h << 15) ^ 0xffffcd7d;
    h ^= (h >>> 10);
    h += (h << 3);
    h ^= (h >>> 6);
    h += (h << 2) + (h << 14);
    return h ^ (h >>> 16);
}
複製程式碼

再雜湊的目的是減少雜湊衝突，使元素能夠均勻地分佈在不同的Segment上，從而提高容器的存取效率。

2.3 操作

2.3.1 get 操作

segment的get操作過程為：先進行一次再雜湊，然後使用這個雜湊值通過雜湊運算定位到Segment，再通過雜湊演算法定位到元素。

public V get(Object key) {
    int hash = hash(key.hashCode());
    return segmentFor(hash).get(key, hash);
}
複製程式碼

get操作的高效之處在於整個get過程不需要加鎖，除非讀到的值為空才加鎖重讀。在它的get方法裡，將要使用的共享變數都定義成volatile型別，如用於統計當前segment大小的count欄位和用於儲存值的HashEntry的value，定義成volatile的變數，能夠線上程之間保持可見性，能夠被多執行緒同時讀，並且保證不會讀到過期的值，在get操作裡，只需要讀而不需要寫共享變數count和value，所以可以不用加鎖。

transient volatile int count;
volatile V value;
複製程式碼

2.3.2 put 操作

由於put方法需要對共享變數進行寫入，所以為了執行緒安全，在操作共享變數時必須加鎖。put方法首先定位到Segment，然後在Segment裡進行插入操作。插入操作需要經歷兩個步驟：

判斷是否需要對Segment裡的HashEntry陣列進行擴容
定位新增元素的位置，然後將其放在HashEntry陣列裡

2.3.3 size 操作

如果要統計整個ConcurrentHashMap裡元素的大小，就必須統計所有Segment元素的大小後求和，雖然每個Segment的全域性變數count是一個volatile變數，在相加時可以獲取最新值，但是不能保證之前累加過的Segment大小不發生變化。

因此，ConcurrentHashMap會先嚐試2次通過不鎖住Segment的方式來統計各個Segment大小，如果統計的過程中，容器的count發生了變化，則再採用加鎖的方式來統計所有Segment的大小。

檢測容器大小是否發生變化的原理為：在put、remove和clean方法裡操作元素前會將變數modCount進行加1，那麼在統計size前後比較modCount是否發生變化，從而得知容器的大小是否發生變化。

三、參考文獻

<<Java併發程式設計的藝術>> - Java併發容器和框架

多執行緒基礎知識點梳理
2023-05-17
執行緒
《面試補習》- 多執行緒知識梳理
2021-06-28
面試執行緒
多執行緒知識梳理(8) – volatile 關鍵字
2019-03-04
執行緒
多執行緒十二之ConcurrentHashMap1.8實現分析
2019-06-14
執行緒HashMap
多執行緒基礎知識
2020-10-07
執行緒
Java多執行緒相關知識
2018-12-27
Java執行緒
多執行緒(三)、執行緒池 ThreadPoolExecutor 知識點總結
2019-12-18
執行緒thread
多執行緒基礎必要知識點！看了學習多執行緒事半功倍
2018-04-23
執行緒
多執行緒之初識執行緒
2020-06-30
執行緒
多執行緒7
2024-09-05
執行緒
ConcurrentHashMap原始碼解析，多執行緒擴容
2020-10-12
HashMap原始碼執行緒
如何實現多執行緒
2023-05-19
執行緒
面經梳理-java多執行緒其他
2024-06-17
Java執行緒
【多執行緒】ThreadLocal原理
2021-09-09
執行緒thread
java多執行緒原理
2021-09-11
Java執行緒
java多執行緒基礎知識速通
2024-10-14
Java執行緒
深入理解多執行緒（一）——Synchronized的實現原理
2018-08-16
執行緒synchronized
多執行緒實現多工二
2019-09-17
執行緒
多執行緒實現多工一
2019-09-17
執行緒
執行緒屏障CyclicBarrier實現原理
2019-02-16
執行緒
執行緒池ThreadPoolExecutor實現原理
2018-05-06
執行緒thread
執行緒池的實現原理
2019-03-12
執行緒
ConcurrentHashMap執行緒安全嗎?
2020-12-27
HashMap執行緒
Android小知識-Java多執行緒相關（執行緒間通訊）上篇
2018-11-28
AndroidJava執行緒
非同步/同步,阻塞/非阻塞,單執行緒/多執行緒概念梳理
2019-02-25
非同步執行緒
Android小知識-Java多執行緒的基礎知識瞭解下
2019-02-26
AndroidJava執行緒
Java多執行緒的實現
2019-01-19
Java執行緒
Java多執行緒實現方式
2020-07-15
Java執行緒
【unity】 Loom實現多執行緒
2024-10-23
UnityOOM執行緒
JavaScript如何實現多執行緒？
2022-12-29
JavaScript執行緒
Runnable介面實現多執行緒
2021-01-02
執行緒
多執行緒具體實現
2021-03-06
執行緒
SpringBoot執行緒池和Java執行緒池的實現原理
2023-04-11
Spring Boot執行緒Java
Java多執行緒學習（五）執行緒間通訊知識點補充
2018-03-26
Java執行緒
多執行緒：原理分析整理
2018-12-15
執行緒
執行緒基本知識點
2020-04-04
執行緒
java多執行緒7：ReentrantReadWriteLock
2021-12-16
Java執行緒
java多執行緒：執行緒池原理、阻塞佇列
2020-10-08
Java執行緒佇列
【Java】ConcurrentHashMap執行緒安全技巧
2020-12-08
JavaHashMap執行緒