HashMap jdk1.7和1.8原始碼剖析
1 概述
HashMap是基於雜湊表實現的,每一個元素是一個key-value對,其內部通過單連結串列解決衝突問題,容量不足(超過了閥值)時,同樣會自動增長.
HashMap是非執行緒安全的,只適用於單執行緒環境,多執行緒環境可以採用併發包下的concurrentHashMap
HashMap 實現了Serializable介面,因此它支援序列化,實現了Cloneable介面,能被克隆
HashMap是基於雜湊表的Map介面的非同步實現.此實現提供所有可選的對映操作,並允許使用null值和null鍵.此類不保證對映的順序,特別是它不保證該順序恆久不變.
Java8中又對此類底層實現進行了優化,比如引入了紅黑樹的結構以解決雜湊碰撞
2 HashMap的資料結構
在Java中,最基本的結構就是兩種,一個是陣列,另外一個是模擬指標(引用),所有的資料結構都可以用這兩個基本結構來構造,HashMap也不例外.
HashMap實際上是一個"連結串列雜湊"的資料結構,即陣列和連結串列的結合體.
HashMap的主結構類似於一個陣列,新增值時通過key確定儲存位置.
每個位置是一個Entry的資料結構,該結構可組成連結串列.
當發生衝突時,相同hash值的鍵值對會組成連結串列.
這種陣列+連結串列的組合形式大部分情況下都能有不錯的效能效果,Java6、7就是這樣設計的.
然而,在極端情況下,一組(比如經過精心設計的)鍵值對都發生了衝突,這時的雜湊結構就會退化成一個連結串列,使HashMap效能急劇下降.
所以在Java8中,HashMap的結構實現變為陣列+連結串列+紅黑樹
可以看出,HashMap底層就是一個陣列結構
陣列中的每一項又是一個連結串列
當新建一個HashMap時,就會初始化一個陣列.
3 三大集合與迭代子
HashMap使用三大集合和三種迭代子來輪詢其Key、Value和Entry物件
public class HashMapExam {
public static void main(String[] args) {
Map map = new HashMap(16);
for (int i = 0; i < 15; i++) {
map.put(i, new String(new char[]{(char) ('A'+ i)}));
}
System.out.println("======keySet=======");
Set set = map.keySet();
Iterator iterator = set.iterator();
while (iterator.hasNext()) {
System.out.println(iterator.next());
}
System.out.println("======values=======");
Collection values = map.values();
Iterator stringIterator=values.iterator();
while (stringIterator.hasNext()) {
System.out.println(stringIterator.next());
}
System.out.println("======entrySet=======");
for (Map.Entry entry : map.entrySet()) {
System.out.println(entry);
}
}
}
4 原始碼分析
//預設的初始容量16,且實際容量是2的整數冪
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
//最大容量(傳入容量過大將被這個值替換)
static final int MAXIMUM_CAPACITY = 1 << 30;
// 預設載入因子為0.75(當表達到3/4滿時,才會再雜湊),這個因子在時間和空間代價之間達到了平衡.更高的因子可以降低表所需的空間,但是會增加查詢代價,而查詢是最頻繁操作
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//桶的樹化閾值:即 連結串列轉成紅黑樹的閾值,在儲存資料時,當連結串列長度 >= 8時,則將連結串列轉換成紅黑樹
static final int TREEIFY_THRESHOLD = 8;
// 桶的連結串列還原閾值:即 紅黑樹轉為連結串列的閾值,當在擴容(resize())時(HashMap的資料儲存位置會重新計算),在重新計算儲存位置後,當原有的紅黑樹內數量 <= 6時,則將 紅黑樹轉換成連結串列
static final int UNTREEIFY_THRESHOLD = 6;
因為紅黑樹的平均查詢長度是log(n),長度為8的時候,平均查詢長度為3,如果繼續使用連結串列,平均查詢長度為8/2=4,這才有轉換為樹的必要
連結串列長度如果是小於等於6,6/2=3,雖然速度也很快的,但是轉化為樹結構和生成樹的時間並不會太短
還有選擇6和8,中間有個差值7可以有效防止連結串列和樹頻繁轉換
假設一下,如果設計成連結串列個數超過8則連結串列轉換成樹結構,連結串列個數小於8則樹結構轉換成連結串列,如果一個HashMap不停的插入、刪除元素,連結串列個數在8左右徘徊,就會頻繁的發生樹轉連結串列、連結串列轉樹,效率會很低。
//最小樹形化容量閾值:即 當雜湊表中的容量 > 該值時,才允許樹形化連結串列 (即 將連結串列 轉換成紅黑樹)
// 為了避免擴容/樹形化選擇的衝突,這個值不能小於 4 * TREEIFY_THRESHOLD
// 小於該值時使用的是擴容哦!!!
static final int MIN_TREEIFY_CAPACITY = 64;
// 儲存資料的Node陣列,長度是2的冪.
// HashMap採用連結串列法解決衝突,每一個Node本質上是一個單向連結串列
//HashMap底層儲存的資料結構,是一個Node陣列.上面得知Node類為元素維護了一個單向連結串列.至此,HashMap儲存的資料結構也就很清晰了:維護了一個陣列,每個陣列又維護了一個單向連結串列.之所以這麼設計,考慮到遇到雜湊衝突的時候,同index的value值就用單向連結串列來維護
//與 JDK 1.7 的對比(Entry類),僅僅只是換了名字
transient Node[] table;
// HashMap的底層陣列中已用槽的數量
transient int size;
// HashMap的閾值,用於判斷是否需要調整HashMap的容量(threshold = 容量*載入因子)
int threshold;
// 負載因子實際大小
final float loadFactor;
// HashMap被改變的次數
transient int modCount;
// 指定“容量大小”和“載入因子”的建構函式,是最基礎的建構函式
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
// HashMap的最大容量只能是MAXIMUM_CAPACITY
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
//負載因子須大於0
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
// 設定"負載因子"
this.loadFactor = loadFactor;
// 設定"HashMap閾值",當HashMap中儲存資料的數量達到threshold時,就需將HashMap的容量加倍
this.threshold = tableSizeFor(initialCapacity);
}
- 上面的tableSizeFor有何用?
tableSizeFor方法保證函式返回值是大於等於給定引數initialCapacity最小的2的冪次方的數值static final int tableSizeFor(int cap) { int n = cap - 1; n |= n >>> 1; n |= n >>> 2; n |= n >>> 4; n |= n >>> 8; n |= n >>> 16; return (n = MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1; }
a |= b 等同於 a = a|b
逐行分析
-
int n = cap - 1
給定的cap 減 1,為了避免引數cap本來就是2的冪次方,這樣一來,經過後續操作,cap將會變成2 * cap,是不符合我們預期的 -
n |= n >>> 1
n >>> 1 : n無符號右移1位,即n二進位制最高位的1右移一位
n | (n >>> 1) 導致 n二進位制的高2位值為1
目前n的高1~2位均為1 -
n |= n >>> 2
n繼續無符號右移2位
n | (n >>> 2) 導致n二進位制表示的高34位經過運算值均為1
目前n的高14位均為1 -
n |= n >>> 4
n繼續無符號右移4位
n | (n >>> 4) 導致n二進位制表示的高58位經過運算值均為1
目前n的高18位均為1 -
n |= n >>> 8
n繼續無符號右移8位
n | (n >>> 8) 導致n二進位制表示的高916位經過運算值均為1
目前n的高116位均為1
可以看出,無論給定cap(cap < MAXIMUM_CAPACITY )的值是多少,經過以上運算,其值的二進位制所有位都會是1.再將其加1,這時候這個值一定是2的冪次方.
當然如果經過運算值大於MAXIMUM_CAPACITY,直接選用MAXIMUM_CAPACITY.
至此tableSizeFor如何保證cap為2的冪次方已經顯而易見了,那麼問題來了
4.1 為什麼cap要保持為2的冪次方?
主要與HashMap中的資料儲存有關.
在Java8中,HashMap中key的Hash值由Hash(key)方法計得
HashMap中儲存資料table的index是由key的Hash值決定的.
在HashMap儲存資料時,我們期望資料能均勻分佈,以防止雜湊衝突.
自然而然我們就會想到去用%取餘操作來實現我們這一構想
取餘(%)操作 : 如果除數是2的冪次則等價於與其除數減一的與(&)操作.
這也就解釋了為什麼一定要求cap要為2的冪次方.再來看看table的index的計算規則
newTab[e.hash & (newCap-1)]=e;
等價於:
index = e.hash % newCap
採用二進位制位操作&,相對於%,能夠提高運算效率,這就是cap的值被要求為2冪次的原因
4.2 Node類
static class Node implements Map.Entry {
final int hash;
final K key;
V value;
Node next;
Node(int hash, K key, V value, Node next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
public final K getKey() { return key; }
public final V getValue() { return value; }
public final String toString() { return key + "=" + value; }
public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value);
}
public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
}
public final boolean equals(Object o) {
if (o == this)
return true;
if (o instanceof Map.Entry) {
Map.Entry e = (Map.Entry)o;
if (Objects.equals(key, e.getKey()) &&
Objects.equals(value, e.getValue()))
return true;
}
return false;
}
}
Node 類是HashMap中的靜態內部類,實現Map.Entry介面.定義了key鍵、value值、next節點,也就是說元素之間構成了單向連結串列.
4.3 TreeNode
static final class TreeNode extends LinkedHashMap.Entry {
TreeNode parent; // red-black tree links
TreeNode left;
TreeNode right;
TreeNode prev; // needed to unlink next upon deletion
boolean red;
TreeNode(int hash, K key, V val, Node next) {}
// 返回當前節點的根節點
final TreeNode root() {
for (TreeNode r = this, p;;) {
if ((p = r.parent) == null)
return r;
r = p;
}
}
}
紅黑樹結構包含前、後、左、右節點,以及標誌是否為紅黑樹的欄位
此結構是Java8新加的
4.4 hash方法
Java 8中的雜湊值優化函式
只做一次16位右位移異或
key.hashCode()函式呼叫的是key鍵值型別自帶的雜湊函式,返回int型雜湊值
理論上雜湊值是一個int型,如果直接拿雜湊值作為下標訪問HashMap主陣列的話,考慮到2進位制32位帶符號的int範圍大概40億的對映空間。只要雜湊函式對映得比較均勻鬆散,一般應用是很難出現碰撞的。
但問題是一個40億長度的陣列,記憶體是放不下的.HashMap擴容之前的陣列初始大小才16,所以這個雜湊值是不能直接拿來用的.
用之前還要先做對陣列的長度取模運算,得到的餘數才能用來訪問陣列下標
原始碼中模運算就是把雜湊值和陣列長度做一個"與"操作,
這也正好解釋了為什麼HashMap的陣列長度要取2的整次冪
因為這樣(陣列長度-1)正好相當於一個“低位掩碼”
“與”操作的結果就是雜湊值的高位全部歸零,只保留低位值,用來做陣列下標訪問
以初始長度16為例,16-1=15
2進製表示是00000000 00000000 00001111
和某雜湊值做“與”操作如下,結果就是擷取了最低的四位值
但這時候問題就來了,這樣就算我的雜湊值分佈再鬆散,要是隻取最後幾位的話,碰撞也會很嚴重
這時候“擾動函式”的價值就體現出來了
右位移16位,正好是32位一半,自己的高半區和低半區做異或,就是為了混合原始hashCode的高位和低位,以此來加大低位的隨機性
而且混合後的低位摻雜了高位的部分特徵,這樣高位的資訊也被變相保留下來。
index的運算規則是
e.hash & (newCap - 1)
newCap是2的冪,所以newCap - 1的高位全0
若e.hash值只用自身的hashcode,index只會和e.hash的低位做&操作.這樣一來,index的值就只有低位參與運算,高位毫無存在感,從而會帶來雜湊衝突的風險
所以在計算key的hashCode時,用其自身hashCode與其低16位做異或操作
這也就讓高位參與到index的計算中來了,即降低了雜湊衝突的風險又不會帶來太大的效能問題
4.5 Put方法
①.判斷鍵值對陣列table[i]是否為空或為null,否則執行resize()進行擴容
②.根據鍵值key計算hash值得到插入的陣列索引i,如果table[i]==null,直接新建節點新增,轉向⑥,如果table[i]不為空,轉向③
③.判斷table[i]的首個元素是否和key一樣,如果相同直接覆蓋value,否則轉向④,這裡的相同指的是hashCode以及equals
④.判斷table[i] 是否為treeNode,即table[i] 是否是紅黑樹,如果是紅黑樹,則直接在樹中插入鍵值對,否則轉向⑤
⑤.遍歷table[i],判斷連結串列長度是否大於8,大於8的話把連結串列轉換為紅黑樹,在紅黑樹中執行插入操作,否則進行連結串列的插入操作;遍歷過程中若發現key已經存在直接覆蓋value即可
⑥.插入成功後,判斷實際存在的鍵值對數量size是否超多了最大容量threshold,如果超過,執行resize()擴容
public V put(K key, V value) {
// 對key的hashCode()做hash
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node[] tab; Node p; int n, i;
// 步驟① tab為空則呼叫resize()初始化建立
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 步驟② 計算index,並對null做處理
//tab[i = (n - 1) & hash對應下標的第一個節點
if ((p = tab[i = (n - 1) & hash]) == null)
// 無雜湊衝突的情況下,將value直接封裝為Node並賦值
tab[i] = newNode(hash, key, value, null);
else {
Node e; K k;
// 步驟③ 節點的key相同,直接覆蓋節點
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 步驟④ 判斷該鏈為紅黑樹
else if (p instanceof TreeNode)
// p是紅黑樹型別,則呼叫putTreeVal方式賦值
e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
// 步驟⑤ p非紅黑樹型別,該鏈為連結串列
else {
// index 相同的情況下
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
// 如果p的next為空,將新的value值新增至連結串列後面
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1)
// 如果連結串列長度大於8,連結串列轉化為紅黑樹,執行插入
treeifyBin(tab, hash);
break;
}
// key相同則跳出迴圈
if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
break;
//就是移動指標方便繼續取 p.next
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
//根據規則選擇是否覆蓋value
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
// 步驟⑥:超過最大容量,就擴容
if (++size > threshold)
// size大於載入因子,擴容
resize();
afterNodeInsertion(evict);
return null;
}
在建構函式中最多也只是設定了initialCapacity、loadFactor的值,並沒有初始化table,table的初始化工作是在put方法中進行的.
4.6 resize
擴容(resize)就是重新計算容量,向HashMap物件裡不停的新增元素,內部的陣列無法裝載更多的元素時,就需要擴大陣列的長度.
當然Java裡的陣列是無法自動擴容的,方法是使用一個新的陣列代替已有的容量小的陣列
/**
* 該函式有2種使用情況:1.初始化雜湊表 2.當前陣列容量過小,需擴容
*/
final Node[] resize() {
Node[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
// 針對情況2:若擴容前的陣列容量超過最大值,則不再擴充
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
// 針對情況2:若無超過最大值,就擴充為原來的2倍
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
//newCap設定為oldCap的2倍並小於MAXIMUM_CAPACITY,且大於預設值, 新的threshold增加為原來的2倍
newThr = oldThr << 1; // double threshold
}
// 針對情況1:初始化雜湊表(採用指定 or 預設值)
else if (oldThr > 0) // initial capacity was placed in threshold
// threshold>0, 將threshold設定為newCap,所以要用tableSizeFor方法保證threshold是2的冪次方
newCap = oldThr;
else { // zero initial threshold signifies using defaults
// 預設初始化
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 計算新的resize上限
if (newThr == 0) {
// newThr為0,newThr = newCap * 0.75
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
// 新生成一個table陣列
Node[] newTab = (Node[])new Node[newCap];
table = newTab;
if (oldTab != null) {
// oldTab 複製到 newTab
for (int j = 0; j < oldCap; ++j) {
Node e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
// 連結串列只有一個節點,直接賦值
//為什麼要重新Hash呢?因為長度擴大以後,Hash的規則也隨之改變。
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
// e為紅黑樹的情況
((TreeNode)e).split(this, newTab, j, oldCap);
else { // preserve order連結串列優化重hash的程式碼塊
Node loHead = null, loTail = null;
Node hiHead = null, hiTail = null;
Node next;
do {
next = e.next;
// 原索引
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
// 原索引 + oldCap
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
// 原索引放到bucket裡
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
// 原索引+oldCap放到bucket裡
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
4.7 remove方法
remove(key) 方法 和 remove(key, value) 方法都是通過呼叫removeNode的方法來實現刪除元素的
final Node removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) {
Node[] tab; Node p; int n, index;
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) {
Node node = null, e; K k; V v;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
// index 元素只有一個元素
node = p;
else if ((e = p.next) != null) {
if (p instanceof TreeNode)
// index處是一個紅黑樹
node = ((TreeNode)p).getTreeNode(hash, key);
else {
// index處是一個連結串列,遍歷連結串列返回node
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
p = e;
} while ((e = e.next) != null);
}
}
// 分不同情形刪除節點
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) {
if (node instanceof TreeNode)
((TreeNode)node).removeTreeNode(this, tab, movable);
else if (node == p)
tab[index] = node.next;
else
p.next = node.next;
++modCount;
--size;
afterNodeRemoval(node);
return node;
}
}
return null;
}
4.8 get
/**
* 函式原型
* 作用:根據鍵key,向HashMap獲取對應的值
*/
map.get(key);
/**
* 原始碼分析
*/
public V get(Object key) {
Node e;
// 1\. 計算需獲取資料的hash值
// 2\. 通過getNode()獲取所查詢的資料 ->>分析1
// 3\. 獲取後,判斷資料是否為空
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
/**
* 分析1:getNode(hash(key), key))
*/
final Node getNode(int hash, Object key) {
Node[] tab; Node first, e; int n; K k;
// 1\. 計算存放在陣列table中的位置
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
// 4\. 通過該函式,依次在陣列、紅黑樹、連結串列中查詢(通過equals()判斷)
// a. 先在陣列中找,若存在,則直接返回
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
// b. 若陣列中沒有,則到紅黑樹中尋找
if ((e = first.next) != null) {
// 在樹中get
if (first instanceof TreeNode)
return ((TreeNode)first).getTreeNode(hash, key);
// c. 若紅黑樹中也沒有,則通過遍歷,到連結串列中尋找
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
在JDK1.7及以前的版本中,HashMap裡是沒有紅黑樹的實現的,在JDK1.8中加入了紅黑樹是為了防止雜湊表碰撞攻擊,當連結串列鏈長度為8時,及時轉成紅黑樹,提高map的效率
如果某個桶中的記錄過大的話(當前是TREEIFY_THRESHOLD = 8),HashMap會動態的使用一個專門的treemap實現來替換掉它。這樣做的結果會更好,是O(logn),而不是糟糕的O(n)。它是如何工作的?
前面產生衝突的那些KEY對應的記錄只是簡單的追加到一個連結串列後面,這些記錄只能通過遍歷來進行查詢。但是超過這個閾值後HashMap開始將列表升級成一個二叉樹,使用雜湊值作為樹的分支變數,如果兩個雜湊值不等,但指向同一個桶的話,較大的那個會插入到右子樹裡。如果雜湊值相等,HashMap希望key值最好是實現了Comparable介面的,這樣它可以按照順序來進行插入。這對HashMap的key來說並不是必須的,不過如果實現了當然最好。如果沒有實現這個介面,在出現嚴重的雜湊碰撞的時候,你就並別指望能獲得效能提升了。
這個效能提升有什麼用處?比方說惡意的程式,如果它知道我們用的是雜湊演算法,它可能會傳送大量的請求,導致產生嚴重的雜湊碰撞。然後不停的訪問這些key就能顯著的影響伺服器的效能,這樣就形成了一次拒絕服務攻擊(DoS)。JDK 8中從O(n)到O(logn)的飛躍,可以有效地防止類似的攻擊,同時也讓HashMap效能的可預測性稍微增強了一些
/**
* 原始碼分析:resize(2 * table.length)
* 作用:當容量不足時(容量 > 閾值),則擴容(擴到2倍)
*/
void resize(int newCapacity) {
// 1\. 儲存舊陣列(old table)
Entry[] oldTable = table;
// 2\. 儲存舊容量(old capacity ),即陣列長度
int oldCapacity = oldTable.length;
// 3\. 若舊容量已經是系統預設最大容量了,那麼將閾值設定成整型的最大值,退出
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
// 4\. 根據新容量(2倍容量)新建1個陣列,即新table
Entry[] newTable = new Entry[newCapacity];
// 5\. (重點分析)將舊陣列上的資料(鍵值對)轉移到新table中,從而完成擴容 ->>分析1.1
transfer(newTable);
// 6\. 新陣列table引用到HashMap的table屬性上
table = newTable;
// 7\. 重新設定閾值
threshold = (int)(newCapacity * loadFactor);
}
/**
* 分析1.1:transfer(newTable);
* 作用:將舊陣列上的資料(鍵值對)轉移到新table中,從而完成擴容
* 過程:按舊連結串列的正序遍歷連結串列、在新連結串列的頭部依次插入
*/
void transfer(Entry[] newTable) {
// 1\. src引用了舊陣列
Entry[] src = table;
// 2\. 獲取新陣列的大小 = 獲取新容量大小
int newCapacity = newTable.length;
// 3\. 通過遍歷 舊陣列,將舊陣列上的資料(鍵值對)轉移到新陣列中
for (int j = 0; j < src.length; j++) {
// 3.1 取得舊陣列的每個元素
Entry e = src[j];
if (e != null) {
// 3.2 釋放舊陣列的物件引用(for迴圈後,舊陣列不再引用任何物件)
src[j] = null;
do {
// 3.3 遍歷 以該陣列元素為首 的連結串列
// 注:轉移連結串列時,因是單連結串列,故要儲存下1個結點,否則轉移後連結串列會斷開
Entry next = e.next;
// 3.3 重新計算每個元素的儲存位置
int i = indexFor(e.hash, newCapacity);
// 3.4 將元素放在陣列上:採用單連結串列的頭插入方式 = 在連結串列頭上存放資料 = 將陣列位置的原有資料放在後1個指標、將需放入的資料放到陣列位置中
// 即 擴容後,可能出現逆序:按舊連結串列的正序遍歷連結串列、在新連結串列的頭部依次插入
e.next = newTable[i];
newTable[i] = e;
// 訪問下1個Entry鏈上的元素,如此不斷迴圈,直到遍歷完該連結串列上的所有節點
e = next;
} while (e != null);
// 如此不斷迴圈,直到遍歷完陣列上的所有資料元素
}
}
}
從上面可看出:在擴容resize()過程中,在將舊陣列上的資料 轉移到 新陣列上時,轉移資料操作 = 按舊連結串列的正序遍歷連結串列、在新連結串列的頭部依次插入,即在轉移資料、擴容後,容易出現連結串列逆序的情況
設重新計算儲存位置後不變,即擴容前 = 1->2->3,擴容後 = 3->2->1
此時若併發執行 put 操作,一旦出現擴容情況,則 容易出現 環形連結串列,從而在獲取資料、遍歷連結串列時 形成死迴圈(Infinite Loop),即死鎖
單執行緒rehash
多執行緒併發下的rehash
這裡假設有兩個執行緒同時執行了put操作並引發了rehash,執行了transfer方法,並假設執行緒一進入transfer方法並執行完next = e.next後,因為執行緒排程所分配時間片用完而“暫停”,此時執行緒二完成了transfer方法的執行。此時狀態如下。
e.next = newTable[1] = null
newTable[1] = e = key(5)
e = next = key(9)
此時迴圈連結串列形成,並且key(11)無法加入到執行緒1的新陣列。在下一次訪問該連結串列時會出現死迴圈。
Fast-fail
產生原因
在使用迭代器的過程中如果HashMap被修改,那麼ConcurrentModificationException將被丟擲,也即Fast-fail策略。
當HashMap的iterator()方法被呼叫時,會構造並返回一個新的EntryIterator物件,並將EntryIterator的expectedModCount設定為HashMap的modCount(該變數記錄了HashMap被修改的次數)。
HashIterator() {
expectedModCount = modCount;
if (size > 0) { // advance to first entry
Entry[] t = table;
while (index < t.length && (next = t[index++]) == null)
;
}
}
在通過該Iterator的next方法訪問下一個Entry時,它會先檢查自己的expectedModCount與HashMap的modCount是否相等,如果不相等,說明HashMap被修改,直接丟擲ConcurrentModificationException。該Iterator的remove方法也會做類似的檢查。該異常的丟擲意在提醒使用者及早意識到執行緒安全問題。
執行緒安全解決方案
單執行緒條件下,為避免出現ConcurrentModificationException,需要保證只通過HashMap本身或者只通過Iterator去修改資料,不能在Iterator使用結束之前使用HashMap本身的方法修改資料。因為通過Iterator刪除資料時,HashMap的modCount和Iterator的expectedModCount都會自增,不影響二者的相等性。如果是增加資料,只能通過HashMap本身的方法完成,此時如果要繼續遍歷資料,需要重新呼叫iterator()方法從而重新構造出一個新的Iterator,使得新Iterator的expectedModCount與更新後的HashMap的modCount相等。
多執行緒條件下,可使用Collections.synchronizedMap方法構造出一個同步Map,或者直接使用執行緒安全的ConcurrentHashMap。
相關文章
- 併發程式設計之ConcurrentHashMap jdk1.7和1.8原始碼剖析程式設計HashMapJDK原始碼
- hashmap和concurrenthashmap原始碼分析(1.7/1.8)HashMap原始碼
- HashMap原始碼剖析HashMap原始碼
- Jdk1.7下的HashMap原始碼分析JDKHashMap原始碼
- JDK1.8 hashMap原始碼分析JDKHashMap原始碼
- HashMap原始碼分析 JDK1.8HashMap原始碼JDK
- JDK1.8原始碼分析之HashMapJDK原始碼HashMap
- JDK1.8原始碼分析筆記-HashMapJDK原始碼筆記HashMap
- Java HashMap 原始碼逐行解析(JDK1.8)JavaHashMap原始碼JDK
- JDK1.8_HashMap原始碼__tableSizeFor方法解析JDKHashMap原始碼
- Jdk1.8下的HashMap原始碼分析JDKHashMap原始碼
- JDk1.7 HashMap原始碼解析——執行緒安全問題JDKHashMap原始碼執行緒
- HashMap原始碼(JDK1.8)-手動註釋HashMap原始碼JDK
- ConcurrentHashMap基於JDK1.8原始碼剖析HashMapJDK原始碼
- 原始碼分析系列1:HashMap原始碼分析(基於JDK1.8)原始碼HashMapJDK
- HashMap就是這麼簡單【原始碼剖析】HashMap原始碼
- 集合框架原始碼學習之HashMap(JDK1.8)框架原始碼HashMapJDK
- 原始碼-JDK1.8HashMap擴容方法resize()解析原始碼JDKHashMap
- 【Java X 原始碼剖析】Collection的原始碼分析-JDK1.8-仍在更新Java原始碼JDK
- 【Java X 原始碼剖析】Map的原始碼分析--JDK1.8-仍在更新Java原始碼JDK
- Java集合——HashMap(jdk1.7)JavaHashMapJDK
- Java原始碼分析:HashMap 1.8 相對於1.7 到底更新了什麼?Java原始碼HashMap
- jdk-HashMap-1.8JDKHashMap
- ConcurrentHashMap (jdk1.7)原始碼學習HashMapJDK原始碼
- Java集合原始碼剖析——ArrayList原始碼剖析Java原始碼
- JDK1.7 和 JDK1.8 共存,快速處理方法及切換JDK
- 原始碼分析——HashMap原始碼HashMap
- HashMap 原始碼分析HashMap原始碼
- HashMap原始碼整理HashMap原始碼
- HashMap原始碼分析HashMap原始碼
- Java HashMap和Go map原始碼對比JavaHashMapGo原始碼
- HashMap原始碼解析和設計解讀HashMap原始碼
- ConcurrentHashMap原始碼刨析(基於jdk1.7)HashMap原始碼JDK
- 元件 popup 設計和原始碼剖析元件原始碼
- Spring原始碼剖析9:Spring事務原始碼剖析Spring原始碼
- Java集合——HashMap(jdk1.8)JavaHashMapJDK
- 一文讀懂JDK1.7,JDK1.8,JDK1.9的hashmap,hashtable,concurrenthashmap及他們的區別JDKHashMap
- [java]HashMap原理剖析JavaHashMap