HashMap1.7與1.8執行緒不安全講解

小豬豬俠！發表於2020-11-13

原文網址 : https://blog.csdn.net/qq_45006487/article/details/109672308

1.jdk1.7中的HashMap

在jdk1.8中對HashMap做了很多優化，這裡先分析在jdk1.7中的問題，相信大家都知道在jdk1.7多執行緒環境下HashMap容易出現死迴圈，這裡我們先用程式碼來模擬出現死迴圈的情況：

public class HashMapTest {

    public static void main(String[] args) {
        HashMapThread thread0 = new HashMapThread();
        HashMapThread thread1 = new HashMapThread();
        HashMapThread thread2 = new HashMapThread();
        HashMapThread thread3 = new HashMapThread();
        HashMapThread thread4 = new HashMapThread();
        thread0.start();
        thread1.start();
        thread2.start();
        thread3.start();
        thread4.start();
    }
}

class HashMapThread extends Thread {
    private static AtomicInteger ai = new AtomicInteger();
    private static Map<Integer, Integer> map = new HashMap<>();

    @Override
    public void run() {
        while (ai.get() < 1000000) {
            map.put(ai.get(), ai.get());
            ai.incrementAndGet();
        }
    }
}

上述程式碼比較簡單，就是開多個執行緒不斷進行put操作，並且HashMap與AtomicInteger都是全域性共享的。在多執行幾次該程式碼後，出現如下死迴圈情形：

其中有幾次還會出現陣列越界的情況：

這裡我們著重分析為什麼會出現死迴圈的情況，通過jps和jstack命名檢視死迴圈情況，結果如下：

從堆疊資訊中可以看到出現死迴圈的位置，通過該資訊可明確知道死迴圈發生在HashMap的擴容函式中，根源在transfer函式中，jdk1.7中HashMap的transfer函式如下：

void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
            while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }

總結下該函式的主要作用：

在對table進行擴容到newTable後，需要將原來資料轉移到newTable中，注意10-12行程式碼，這裡可以看出在轉移元素的過程中，使用的是頭插法，也就是連結串列的順序會翻轉，這裡也是形成死迴圈的關鍵點。

下面進行詳細分析。

1.1 擴容造成死迴圈分析過程

前提條件：

這裡假設

hash演算法為簡單的用key mod連結串列的大小。
最開始hash表size=2，key=3,7,5，則都在table[1]中。
然後進行resize，使size變成4。

未resize前的資料結構如下：

如果在單執行緒環境下，最後的結果如下：

這裡的轉移過程，不再進行詳述，只要理解transfer函式在做什麼，其轉移過程以及如何對連結串列進行反轉應該不難。

然後在多執行緒環境下，假設有兩個執行緒A和B都在進行put操作。執行緒A在執行到transfer函式中第11行程式碼處掛起，因為該函式在這裡分析的地位非常重要，因此再次貼出來。

此時執行緒A中執行結果如下：

執行緒A掛起後，此時執行緒B正常執行，並完成resize操作，結果如下：

這裡需要特別注意的點：由於執行緒B已經執行完畢，根據Java記憶體模型，現在newTable和table中的Entry都是主存中最新值：7.next=3，3.next=null。

此時切換到執行緒A上，線上程A掛起時記憶體中值如下：e=3，next=7，newTable[3]=null，程式碼執行過程如下：

newTable[3]=e ----> newTable[3]=3
e=next ----> e=7

此時結果如下：

繼續迴圈：

e=7
next=e.next ----> next=3【從主存中取值】
e.next=newTable[3] ----> e.next=3【從主存中取值】
newTable[3]=e ----> newTable[3]=7
e=next ----> e=3

結果如下：

再次進行迴圈：

e=3
next=e.next ----> next=null
e.next=newTable[3] ----> e.next=7 即：3.next=7
newTable[3]=e ----> newTable[3]=3
e=next ----> e=null

注意此次迴圈：e.next=7，而在上次迴圈中7.next=3，出現環形連結串列，並且此時e=null迴圈結束。

結果如下：

在後續操作中只要涉及輪詢hashmap的資料結構，就會在這裡發生死迴圈，造成悲劇。

1.2 擴容造成資料丟失分析過程

遵照上述分析過程，初始時：

執行緒A和執行緒B進行put操作，同樣執行緒A掛起：

此時執行緒A的執行結果如下：

此時執行緒B已獲得CPU時間片，並完成resize操作：

同樣注意由於執行緒B執行完成，newTable和table都為最新值：5.next=null。

此時切換到執行緒A，線上程A掛起時：e=7，next=5，newTable[3]=null。

執行newtable[i]=e，就將7放在了table[3]的位置，此時next=5。接著進行下一次迴圈：

e=5
next=e.next ----> next=null，從主存中取值
e.next=newTable[1] ----> e.next=5，從主存中取值
newTable[1]=e ----> newTable[1]=5
e=next ----> e=null

將5放置在table[1]位置，此時e=null迴圈結束，3元素丟失，並形成環形連結串列。並在後續操作hashmap時造成死迴圈。

2.jdk1.8中HashMap

在jdk1.8中對HashMap進行了優化，在發生hash碰撞，不再採用頭插法方式，而是直接插入連結串列尾部，因此不會出現環形連結串列的情況，但是在多執行緒的情況下仍然不安全，這裡我們看jdk1.8中HashMap的put操作原始碼：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null) // 如果沒有hash碰撞則直接插入元素
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

這是jdk1.8中HashMap中put操作的主函式，注意第6行程式碼

如果沒有hash碰撞則會直接插入元素。如果執行緒A和執行緒B同時進行put操作，剛好這兩條不同的資料hash值一樣，並且該位置資料為null，所以這執行緒A、B都會進入第6行程式碼中

假設一種情況，執行緒A進入後還未進行資料插入時掛起，而執行緒B正常執行，從而正常插入資料，然後執行緒A獲取CPU時間片，此時執行緒A不用再進行hash判斷了，問題出現：執行緒A會把執行緒B插入的資料給覆蓋，發生執行緒不安全。

總結

首先HashMap是執行緒不安全的，其主要體現：

在jdk1.7中，在多執行緒環境下，擴容時會造成環形鏈或資料丟失。
在jdk1.8中，在多執行緒環境下，會發生資料覆蓋的情況。

Java執行緒(一)：執行緒安全與不安全
2021-12-05
Java執行緒
什麼是執行緒安全和執行緒不安全
2018-07-22
執行緒
ArrayList執行緒不安全怎麼辦？（CopyOnWriteArrayList詳解）
2021-08-29
執行緒
HashMap為何執行緒不安全
2019-01-23
HashMap執行緒
執行緒池原理（JDK1.8）
2018-08-06
執行緒JDK
Thread執行緒知識點講解
2022-03-29
thread執行緒
C#基礎之多執行緒講解
2024-12-01
C#執行緒
執行緒與多執行緒
2024-08-11
執行緒
java多執行緒與併發 - 執行緒池詳解
2018-03-13
Java執行緒
SimpleDateFormat一定是執行緒不安全嗎？
2021-04-21
ORM執行緒
多執行緒------執行緒與程式/執行緒排程/建立執行緒
2020-12-31
執行緒
執行緒、執行緒與程式、ULT與KLT
2020-12-22
執行緒
java 多執行緒（關於Thread的講解）
2020-02-08
Java執行緒thread
jdk1.8 執行緒池部分原始碼分析
2018-09-19
JDK執行緒原始碼
什麼時候執行緒不安全？怎樣做到執行緒安全？怎麼擴充套件執行緒安全的類？
2018-09-15
執行緒套件
java--執行緒池--建立執行緒池的幾種方式與執行緒池操作詳解
2021-07-13
Java執行緒
【多執行緒總結(二)－執行緒安全與執行緒同步】
2018-09-09
執行緒
集合框架與執行緒安全解決
2020-11-22
框架執行緒
Flutter非同步與執行緒詳解
2022-05-09
Flutter非同步執行緒
Android程式框架：執行緒與執行緒池
2019-02-27
Android框架執行緒
第1講：程序和執行緒
2024-06-10
執行緒
造成類在多執行緒時不安全的原因
2019-03-01
執行緒
多執行緒十二之ConcurrentHashMap1.8實現分析
2019-06-14
執行緒HashMap
Java多執行緒學習（3）執行緒同步與執行緒通訊
2018-10-15
Java執行緒
程式與執行緒
2019-09-09
執行緒
Java與執行緒
2024-10-07
Java執行緒
程序與執行緒
2024-08-16
執行緒
執行緒與程序
2024-06-25
執行緒
執行緒與程式
2021-09-11
執行緒
多執行緒03：?執行緒傳參詳解
2022-05-11
執行緒
安全函式不安全-多執行緒慎用List.h
2021-12-27
函式執行緒
HashMap為何執行緒不安全？HashMap，HashTable，ConcurrentHashMap對比
2022-11-30
HashMap執行緒
29-HashMap 為什麼是執行緒不安全的？
2020-12-26
HashMap執行緒
深入理解JVM（③）執行緒與Java的執行緒
2020-07-11
JVM執行緒Java
多執行緒與高併發(二)執行緒安全
2019-06-30
執行緒
併發與多執行緒之執行緒安全篇
2022-01-04
執行緒
【多執行緒與高併發】- 執行緒基礎與狀態
2023-02-16
執行緒
Java多執行緒學習（1）建立執行緒與執行緒的生命週期
2018-10-10
Java執行緒

HashMap1.7與1.8執行緒不安全講解

1.jdk1.7中的HashMap

1.1 擴容造成死迴圈分析過程

1.2 擴容造成資料丟失分析過程

2.jdk1.8中HashMap

總結

相關文章