HashMap原理21問

小垣發表於2020-10-08

原文網址 : https://blog.csdn.net/junlong750/article/details/108959371

1：HashMap 的資料結構？

A：雜湊表結構（連結串列雜湊：陣列+連結串列）實現，結合陣列和連結串列的優點。當連結串列長度超過 8 時，連結串列轉換為紅黑樹。transient Node[] table;

2：HashMap 的工作原理？

HashMap 底層是 hash 陣列和單向連結串列實現，陣列中的每個元素都是連結串列，由 Node 內部類（實現 Map.Entry介面）實現，HashMap 通過 put & get 方法儲存和獲取。

儲存物件時，將 K/V 鍵值傳給 put() 方法：

1、呼叫 hash(K) 方法計算 K 的 hash 值，然後結合陣列長度，計算得陣列下標；
2、調整陣列大小（當容器中的元素個數大於 capacity * loadfactor 時，容器會進行擴容resize 為 2n）；
3、i.如果 K 的 hash 值在 HashMap 中不存在，則執行插入，若存在，則發生碰撞；

ii.如果 K 的 hash 值在 HashMap 中存在，且它們兩者 equals 返回 true，則更新鍵值對；

iii. 如果 K 的 hash 值在 HashMap 中存在，且它們兩者 equals 返回 false，則插入連結串列的尾部（尾插法）或者紅黑樹中（樹的新增方式）。

（JDK 1.7 之前使用頭插法、JDK 1.8 使用尾插法）（注意：當碰撞導致連結串列大於 TREEIFY_THRESHOLD = 8 時，就把連結串列轉換成紅黑樹）

獲取物件時，將 K 傳給 get() 方法：①、呼叫 hash(K) 方法（計算 K 的 hash 值）從而獲取該鍵值所在連結串列的陣列下標；②、順序遍歷連結串列，equals()方法查詢相同 Node 連結串列中 K 值對應的 V 值。

hashCode 是定位的，儲存位置；equals是定性的，比較兩者是否相等。

3.當兩個物件的 hashCode 相同會發生什麼？

因為 hashCode 相同，不一定就是相等的（equals方法比較），所以兩個物件所在陣列的下標相同，"碰撞"就此發生。又因為 HashMap 使用連結串列儲存物件，這個 Node 會儲存到連結串列中。

4.你知道 hash 的實現嗎？為什麼要這樣實現？

JDK 1.8 中，是通過 hashCode() 的高 16 位異或低 16 位實現的：(h = k.hashCode()) ^ (h >>> 16)，主要是從速度，功效和質量來考慮的，減少系統的開銷，也不會造成因為高位沒有參與下標的計算，從而引起的碰撞。

5.為什麼要用異或運算子？

保證了物件的 hashCode 的 32 位值只要有一位發生改變，整個 hash() 返回值就會改變。儘可能的減少碰撞。

6.HashMap 的 table 的容量如何確定？loadFactor 是什麼？該容量如何變化？這種變化會帶來什麼問題？

1、table 陣列大小是由 capacity 這個引數確定的，預設是16，也可以構造時傳入，最大限制是1<<30；
2、loadFactor 是裝載因子，主要目的是用來確認table 陣列是否需要動態擴充套件，預設值是0.75，比如table 陣列大小為 16，裝載因子為 0.75 時，threshold 就是12，當 table 的實際大小超過 12 時，table就需要動態擴容；
3、擴容時，呼叫 resize() 方法，將 table 長度變為原來的兩倍（注意是 table 長度，而不是 threshold）
4、如果資料很大的情況下，擴充套件時將會帶來效能的損失，在效能要求很高的地方，這種損失很可能很致命。

7.HashMap 中 put 方法的過程？

答：“呼叫雜湊函式獲取Key對應的hash值，再計算其陣列下標；

1、如果沒有出現雜湊衝突，則直接放入陣列；如果出現雜湊衝突，則以連結串列的方式放在連結串列後面；
2、如果連結串列長度超過閥值( TREEIFY THRESHOLD==8)，就把連結串列轉成紅黑樹，連結串列長度低於6，就把紅黑樹轉回連結串列;
3、如果結點的key已經存在，則替換其value即可；
4、如果集合中的鍵值對大於12，呼叫resize方法進行陣列擴容。

8.陣列擴容的過程？

建立一個新的陣列，其容量為舊陣列的兩倍，並重新計算舊陣列中結點的儲存位置。結點在新陣列中的位置只有兩種，原下標位置或原下標+舊陣列的大小。

9.拉鍊法導致的連結串列過深問題為什麼不用二叉查詢樹代替，而選擇紅黑樹？為什麼不一直使用紅黑樹？

之所以選擇紅黑樹是為了解決二叉查詢樹的缺陷，二叉查詢樹在特殊情況下會變成一條線性結構（這就跟原來使用連結串列結構一樣了，造成很深的問題），遍歷查詢會非常慢。而紅黑樹在插入新資料後可能需要通過左旋，右旋、變色這些操作來保持平衡，引入紅黑樹就是為了查詢資料快，解決連結串列查詢深度的問題，我們知道紅黑樹屬於平衡二叉樹，但是為了保持“平衡”是需要付出代價的，但是該代價所損耗的資源要比遍歷線性連結串列要少，所以當長度大於8的時候，會使用紅黑樹，如果連結串列長度很短的話，根本不需要引入紅黑樹，引入反而會慢。

10.說說你對紅黑樹的見解？

1、每個節點非紅即黑
2、根節點總是黑色的
3、如果節點是紅色的，則它的子節點必須是黑色的（反之不一定）
4、每個葉子節點都是黑色的空節點（NIL節點）
5、從根節點到葉節點或空子節點的每條路徑，必須包含相同數目的黑色節點（即相同的黑色高度）

11.Java8 中對 HashMap 做了哪些改變？

1、在 Java 1.8 中，如果連結串列的長度超過了 8，那麼連結串列將轉換為紅黑樹。（桶的數量必須大於 64，小於 64 的時候只會擴容）
2、發生 hash 碰撞時，Java 1.7 會在連結串列的頭部插入，而 Java 1.8 會在連結串列的尾部插入
3、在 Java 1.8 中，Entry 被 Node 替代(換了一個馬甲)。

12.HashMap，LinkedHashMap，TreeMap 有什麼區別？

HashMap 參考其他問題；

LinkedHashMap 儲存了記錄的插入順序，在用 Iterator 遍歷時，先取到的記錄肯定是先插入的；遍歷比 HashMap 慢；

TreeMap 實現 SortMap 介面，能夠把它儲存的記錄根據鍵排序（預設按鍵值升序排序，也可以指定排序的比較器）

13.HashMap & TreeMap & LinkedHashMap 使用場景？

一般情況下，使用最多的是 HashMap。HashMap：在 Map 中插入、刪除和定位元素時；TreeMap：在需要按自然順序或自定義順序遍歷鍵的情況下；LinkedHashMap：在需要輸出的順序和輸入的順序相同的情況下。

14.HashMap 和 HashTable 有什麼區別？

1、HashMap 是執行緒不安全的，HashTable 是執行緒安全的；
2、由於執行緒安全，所以 HashTable 的效率比不上 HashMap；
3、HashMap最多隻允許一條記錄的鍵為null，允許多條記錄的值為null，而 HashTable不允許；
4、HashMap 預設初始化陣列的大小為16，HashTable 為 11，前者擴容時，擴大兩倍，後者擴大兩倍+1；
5、HashMap 需要重新計算 hash 值，而 HashTable 直接使用物件的 hashCode

15.Java 中的另一個執行緒安全的與 HashMap 極其類似的類是什麼？同樣是執行緒安全，它與 HashTable 線上程同步上有什麼不同？

ConcurrentHashMap 類（是 Java併發包 java.util.concurrent 中提供的一個執行緒安全且高效的 HashMap 實現）。

HashTable 是使用 synchronize 關鍵字加鎖的原理（就是對物件加鎖）；

而針對 ConcurrentHashMap，在 JDK 1.7 中採用分段鎖的方式；JDK 1.8 中直接採用了CAS（無鎖演算法）+ synchronized。

16.HashMap & ConcurrentHashMap 的區別？

除了加鎖，原理上無太大區別。另外，HashMap 的鍵值對允許有null，但是ConCurrentHashMap 都不允許。

17.為什麼 ConcurrentHashMap 比 HashTable 效率要高？

HashTable 使用一把鎖（鎖住整個連結串列結構）處理併發問題，多個執行緒競爭一把鎖，容易阻塞；

ConcurrentHashMap

JDK 1.7 中使用分段鎖（ReentrantLock + Segment + HashEntry），相當於把一個 HashMap 分成多個段，每段分配一把鎖，這樣支援多執行緒訪問。鎖粒度：基於 Segment，包含多個 HashEntry。

JDK 1.8 中使用 CAS + synchronized + Node + 紅黑樹。鎖粒度：Node（首結點）（實現 Map.Entry）。鎖粒度降低了。

18.針對 ConcurrentHashMap 鎖機制具體分析（JDK 1.7 VS JDK 1.8）？

JDK 1.7 中，採用分段鎖的機制，實現併發的更新操作，底層採用陣列+連結串列的儲存結構，包括兩個核心靜態內部類 Segment 和 HashEntry。

1、Segment 繼承 ReentrantLock（重入鎖）用來充當鎖的角色，每個 Segment 物件守護每個雜湊對映表的若干個桶；
2、HashEntry 用來封裝對映表的鍵-值對；
3、每個桶是由若干個 HashEntry 物件連結起來的連結串列

JDK 1.8 中，採用Node + CAS + Synchronized來保證併發安全。取消類 Segment，直接用 table 陣列儲存鍵值對；當 HashEntry 物件組成的連結串列長度超過 TREEIFY_THRESHOLD 時，連結串列轉換為紅黑樹，提升效能。底層變更為陣列 + 連結串列 + 紅黑樹。

19.ConcurrentHashMap 在 JDK 1.8 中，為什麼要使用內建鎖 synchronized 來代替重入鎖 ReentrantLock？

1、粒度降低了；
2、JVM 開發團隊沒有放棄 synchronized，而且基於 JVM 的 synchronized 優化空間更大，更加自然。
3、在大量的資料操作下，對於 JVM 的記憶體壓力，基於 API 的 ReentrantLock 會開銷更多的記憶體。

20.ConcurrentHashMap 簡單介紹？

1、重要的常量：

private transient volatile int sizeCtl;當為負數時，-1 表示正在初始化，-N 表示 N - 1 個執行緒正在進行擴容；當為 0 時，表示 table 還沒有初始化；當為其他正數時，表示初始化或者下一次進行擴容的大小。

1、資料結構：

Node 是儲存結構的基本單元，繼承 HashMap 中的 Entry，用於儲存資料；TreeNode 繼承 Node，但是資料結構換成了二叉樹結構，是紅黑樹的儲存結構，用於紅黑樹中儲存資料；TreeBin 是封裝 TreeNode 的容器，提供轉換紅黑樹的一些條件和鎖的控制。

3、儲存物件時（put() 方法）：

1、如果沒有初始化，就呼叫 initTable() 方法來進行初始化；
2、如果沒有 hash 衝突就直接 CAS 無鎖插入；
3、如果需要擴容，就先進行擴容；
4、如果存在 hash 衝突，就加鎖來保證執行緒安全，兩種情況：一種是連結串列形式就直接遍歷到尾端插入，一種是紅黑樹就按照紅黑樹結構插入；
5、如果該連結串列的數量大於閥值 8，就要先轉換成紅黑樹的結構，break 再一次進入迴圈
6、如果新增成功就呼叫 addCount() 方法統計 size，並且檢查是否需要擴容。

4、擴容方法 transfer()：預設容量為 16，擴容時，容量變為原來的兩倍。

helpTransfer()：呼叫多個工作執行緒一起幫助進行擴容，這樣的效率就會更高。

5、獲取物件時（get()方法）：

1、計算 hash 值，定位到該 table 索引位置，如果是首結點符合就返回；
2、如果遇到擴容時，會呼叫標記正在擴容結點 ForwardingNode.find()方法，查詢該結點，匹配就返回；
3、以上都不符合的話，就往下遍歷結點，匹配就返回，否則最後就返回 null。

21.ConcurrentHashMap 的併發度是什麼？

程式執行時能夠同時更新 ConccurentHashMap 且不產生鎖競爭的最大執行緒數。預設為 16，且可以在建構函式中設定。當使用者設定併發度時，ConcurrentHashMap 會使用大於等於該值的最小2冪指數作為實際併發度（假如使用者設定併發度為17，實際併發度則為32）

HashMap原理
2022-01-14
HashMap
求求你們不要再問HashMap原理了....
2019-03-06
HashMap
HashMap中面試常問的工作原理
2021-09-09
HashMap面試
面試必問：HashMap 底層實現原理分析
2019-04-26
面試HashMap
HashMap擴容原理
2024-05-16
HashMap
[java]HashMap原理剖析
2019-03-20
JavaHashMap
阿里面試官最喜歡問的21個HashMap面試題
2020-06-21
阿里HashMap面試題
HashMap的底層原理
2021-05-15
HashMap
JDK1.7-HashMap原理
2021-01-14
JDKHashMap
HashMap原理底層剖析
2021-05-07
HashMap
HashMap原理詳解，包括底層原理
2024-11-21
HashMap
HashMap底層實現原理
2020-07-29
HashMap
HashMap的底層原理分析
2020-10-16
HashMap
HashMap底層實現原理/HashMap與HashTable區別/HashMap與HashSet區別
2018-05-05
HashMap
HashMap原理(二) 擴容機制及存取原理
2019-07-08
HashMap
Java中HashMap的實現原理
2018-08-11
JavaHashMap
深度解析HashMap集合底層原理
2021-10-29
HashMap
乾貨：HashMap的工作原理解析
2019-03-04
HashMap
HashMap、Hashtable、ConcurrentHashMap的原理與區別
2019-01-22
HashMap
HashMap實現原理及原始碼分析
2018-07-30
HashMap原始碼
HashMap 實現原理與原始碼分析
2019-04-26
HashMap原始碼
Java:HashMap原理與設計緣由
2019-07-04
JavaHashMap
原始碼的魅力 – HashMap 的工作原理
2019-03-04
原始碼HashMap
java面試題-HashMap的工作原理
2019-02-18
Java面試題HashMap
HashMap的實現原理 HashMap底層實現，hashCode如何對應bucket?
2018-03-27
HashMap
HashMap設計原理與實現（下篇）200行帶你寫自己的HashMap！！！
2022-07-12
HashMap
漫畫：什麼是HashMap？（底層原理）
2019-09-07
HashMap
【JDK原始碼分析】淺談HashMap的原理
2020-03-07
JDK原始碼HashMap
面試題總結：HashMap實現原理
2020-10-29
面試題HashMap
HashMap原理(一) 概念和底層架構
2019-07-06
HashMap架構
Java集合詳解（三）：HashMap原理解析
2021-05-23
JavaHashMap
JAVA系列：HashMap常見問題
2020-10-13
JavaHashMap
Java HashMap原理及內部儲存結構
2019-01-18
JavaHashMap
最通俗易懂搞定HashMap的底層原理
2019-12-06
HashMap
Java進階：HashMap底層原理（通俗易懂篇）
2024-07-05
JavaHashMap
HashMap的實現原理(看這篇就夠了）
2022-01-17
HashMap
HashMap的底層結構、原理、擴容機制
2020-12-19
HashMap
BAT面試必問HashMap原始碼分析
2019-05-20
BAT面試HashMap原始碼