Java 進階必備:HashMap 原始碼分析

jeanboy發表於2019-04-10

簡介

HashMap 是 Java 語言中常用的用於存放鍵值對資料型別的集合類。隨著 JDK(Java Developmet Kit)版本的更新,JDK 1.8 對 HashMap 底層的實現進行了優化,底層實現也由之前的 陣列 + 連結串列 改為 陣列 + 連結串列 + 紅黑樹 。HashMap 的常用方法如下:

//建立一個 map
Map<String, String> map = new HashMap<>();

//如果 key 不存在則插入資料,如果 key 已存在則更新資料
map.put("test", "哈哈");

//根據 key 獲取 value
map.get("test");

//上面已經插入了 key,這裡相當更新 key 的 value
map.put("test", "呵呵");

//刪除 key 及 value
map.remove("test");

//遍歷
for (String key : map.keySet()) {
    System.out.println(key);
}
複製程式碼

原理分析

從 JDK 1.8 開始 HashMap 底層採用 陣列 + 連結串列 + 紅黑樹 來實現,如下圖:

Java 進階必備:HashMap 原始碼分析

從原始碼可知,HashMap 類中有一個非常重要的欄位,就是 Node[] table 即雜湊桶陣列,明顯它是一個Node 的陣列。我們來看下 Node 是什麼。

static class Node<K, V> implements Map.Entry<K, V> {
    final int hash;//用來定位陣列索引位置
    final K key;
    V value;
    Node<K, V> next;//連結串列的下一個 node

    Node(int hash, K key, V value, Node<K, V> next) { ... }
    public final K getKey(){ ... }
    public final V getValue() { ... }
    public final String toString() { ... }
    public final int hashCode() { ... }
    public final V setValue(V newValue) { ... }
    public final boolean equals(Object o) { ... }
}
複製程式碼

Node 是 HashMap 的一個內部類,實現了 Map.Entry 介面,本質是就是一個對映(鍵值對)。上圖中的每個黑色圓點就是一個 Node 物件。

構造方法

首先我們來看下 HashMap 的構造方法,從原始碼中可以看到 HashMap 有 4 個構造方法。

/** 構造方法 1 */
public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
}

/** 構造方法 2 */
public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

/** 構造方法 3 */
public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
}

/** 構造方法 4 */
public HashMap(Map<? extends K, ? extends V> m) {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    putMapEntries(m, false);
}
複製程式碼

上面 4 個構造方法中,大家平時用的最多的應該是第一個了。第一個構造方法很簡單,僅將 loadFactor 變數設為預設值。構造方法 2 呼叫了構造方法 3,而構造方法 3 仍然只是設定了一些變數。構造方法 4 則是將另一個 Map 中的對映拷貝一份到自己的儲存結構中來,這個方法不是很常用。

我們得先了解下 HashMap 的幾個欄位,從 HashMap 的預設構造方法原始碼可知,構造方法就是對下面幾個欄位進行初始化:

/** The default initial capacity - MUST be a power of two. */
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

/** The load factor used when none specified in constructor. */
static final float DEFAULT_LOAD_FACTOR = 0.75f;// 負載因子

/** The next size value at which to resize (capacity * load factor). */
int threshold;// 所能容納的 key - value 對極限 

/** The load factor for the hash table. */
final float loadFactor;
複製程式碼

首先,Node[] table 的初始化長度 length(預設值是 16),loadFactor 為負載因子(預設值是 0.75),threshold 是 HashMap 所能容納的最大資料量的 Node(鍵值對)個數。threshold = length * loadFactor。也就是說,在陣列定義好長度之後,負載因子越大,所能容納的鍵值對個數越多。

結合負載因子的定義公式可知,threshold 就是在此 loadFactor 和 length(陣列長度)對應下允許的最大元素數目,超過這個數目就重新 resize(擴容),擴容後的 HashMap 容量是之前容量的兩倍。預設的負載因子 0.75 是對空間和時間效率的一個平衡選擇,建議大家不要修改,除非在時間和空間比較特殊的情況下,如果記憶體空間很多而又對時間效率要求很高,可以降低負載因子 loadFactor 的值;相反,如果記憶體空間緊張而對時間效率要求不高,可以增加負載因子 loadFactor 的值,這個值可以大於 1。

這裡存在一個問題,即使負載因子和 Hash 演算法設計的再合理,也免不了會出現拉鍊過長的情況,一旦出現拉鍊過長,則會嚴重影響 HashMap 的效能。於是,在 JDK1.8 版本中,對資料結構做了進一步的優化,引入了紅黑樹。而當連結串列長度太長(預設超過 8)時,連結串列就轉換為紅黑樹,利用紅黑樹快速增刪改查的特點提高 HashMap 的效能,其中會用到紅黑樹的插入、刪除、查詢等演算法。這裡不再對紅黑樹展開討論,想了解更多紅黑樹資料結構的工作原理可以參考 :blog.csdn.net/v_july_v/ar…

索引 Key 的位置

不管增加、刪除、查詢鍵值對,定位到雜湊桶陣列的位置都是很關鍵的第一步。前面說過 HashMap 的資料結構是陣列和連結串列的結合,所以我們當然希望這個 HashMap 裡面的元素位置儘量分佈均勻些,儘量使得每個位置上的元素數量只有一個。那麼當我們用 hash 演算法求得這個位置的時候,馬上就可以知道對應位置的元素就是我們要的,不用遍歷連結串列,大大優化了查詢的效率。

計算 hash 的方法如下:

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
複製程式碼

這裡 key.hashCode() 函式呼叫的是 key 鍵值型別自帶的雜湊函式,返回 int 型別的雜湊值。理論上雜湊值是一個 int 型別,如果直接拿來作為下標訪問 HashMap 的主陣列的話,考慮到 2 進位制 32 位帶符號的 int 的範圍從 -2147483648 ~ 2147483647,前後加起來大概 40 億的對映空間。只要雜湊函式對映的比較均勻鬆散,一般應用是很難出現碰撞的。

但問題是一個 40 億長度的陣列,記憶體是放不下的。所以這裡使用對陣列的長度取模運算,得到的餘數才能用來方位陣列的下標。

bucketIndex = indexFor(hash, table.length);
複製程式碼

JDK 1.7 中的獲取陣列索引位置的方法:

static int indexFor(int h, int length) {
    return h & (length - 1);//相當於 h % length
}
複製程式碼

這裡正好解釋了為什麼 HashMap 的陣列長度要設計為 2 的整次冪,因為這樣 h & (length - 1) 正好相當於 h % length。由於取餘的計算效率沒有位運算高,所以是一個小的優化,關於模除的詳細介紹請參考 維基百科 - 模除 - 效能問題

但是問題又來了,這樣就算我們的雜湊值分佈再鬆散,僅僅是取最後幾位的話,碰撞也會很嚴重,更何況雜湊本身也不是很完美。所以這裡原始碼做了一下高位移位,將高位也加入計算。

Java 進階必備:HashMap 原始碼分析

這裡右移 16 位正好是 32bit 的一半,將高半區與低半區做異或,就是為了混合原始雜湊碼的高位和低位來加大低位的隨機性。並且混合後的低位加入了高位的部分特徵,高位的資訊也被保留了下來。

put()

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // 1. tab 為空則建立
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // 2. 計算 index,並對 null 做處理 
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        // 3. 節點 key 存在,直接覆蓋 value
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        // 4. 判斷該鏈為紅黑樹
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
             // 5. 該鏈為連結串列,對連結串列進行遍歷,並統計連結串列長度
            for (int binCount = 0; ; ++binCount) {
                // 連結串列中不包含要插入的鍵值對節點時,則將該節點接在連結串列的最後
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 如果連結串列長度大於或等於樹化閾值,則進行樹化操作
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                // 條件為 true,表示當前連結串列包含要插入的鍵值對,終止遍歷
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        // 判斷要插入的鍵值對是否存在 HashMap 中
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            // onlyIfAbsent 表示是否僅在 oldValue 為 null 的情況下更新鍵值對的值
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    // 6. 超過最大容量時,則進行擴容
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}
複製程式碼
  1. 判斷鍵值對陣列 table[] 是否為空或為 null,否則執行 resize() 進行擴容;

  2. 根據鍵值 key 計算 hash 值得到插入的陣列索引 i,如果 table[i] == null,直接新建節點新增,轉向 6,如果 table[i] 不為空,轉向 3;

  3. 判斷 table[i] 的首個元素是否和 key 一樣,如果相同直接覆蓋 value,否則轉向 4,這裡的相同指的是 hashCode 以及 equals;

  4. 判斷 table[i] 是否為 treeNode,即 table[i] 是否是紅黑樹,如果是紅黑樹,則直接在樹中插入鍵值對,否則轉向 5;

  5. 遍歷 table[i],判斷連結串列長度是否大於 8,大於 8 的話把連結串列轉換為紅黑樹,在紅黑樹中執行插入操作,否則進行連結串列的插入操作;遍歷過程中若發現 key 已經存在直接覆蓋 value 即可;

  6. 插入成功後,判斷實際存在的鍵值對數量 size 是否超多了最大容量 threshold,如果超過,進行擴容。

擴容機制

擴容(resize)就是重新計算容量,向 HashMap 物件裡不停的新增元素,而 HashMap 物件內部的陣列無法裝載更多的元素時,物件就需要擴大陣列的長度,以便能裝入更多的元素。當然 Java 裡的陣列是無法自動擴容的,方法是使用一個新的陣列代替已有的容量小的陣列,就像我們用一個小桶裝水,如果想裝更多的水,就得換大水桶。

我們分析下 resize 的原始碼,鑑於 JDK 1.8 融入了紅黑樹,較複雜,為了便於理解我們仍然使用 JDK 1.7 的程式碼,好理解一些,本質上區別不大,具體區別後文再說。

void resize(int newCapacity) {   //傳入新的容量
    Entry[] oldTable = table;    //引用擴容前的 Entry 陣列
    int oldCapacity = oldTable.length;         
    if (oldCapacity == MAXIMUM_CAPACITY) {  //擴容前的陣列大小如果已經達到最大(2^30)了
        threshold = Integer.MAX_VALUE; //修改閾值為 int 的最大值(2^31-1),這樣以後就不會擴容了
        return;
    }
  
    Entry[] newTable = new Entry[newCapacity];  //初始化一個新的 Entry 陣列
    transfer(newTable);                         //!!將資料轉移到新的 Entry 陣列裡
    table = newTable;                           //HashMap 的 table 屬性引用新的 Entry 陣列
    threshold = (int)(newCapacity * loadFactor);//修改閾值
}
複製程式碼

這裡就是使用一個容量更大的陣列來代替已有的容量小的陣列,transfer() 方法將原有 Entry 陣列的元素拷貝到新的 Entry 陣列裡。

void transfer(Entry[] newTable) {
    Entry[] src = table;                   //src引用了舊的Entry陣列
    int newCapacity = newTable.length;
    for (int j = 0; j < src.length; j++) { //遍歷舊的Entry陣列
        Entry<K,V> e = src[j];             //取得舊Entry陣列的每個元素
        if (e != null) {
            src[j] = null;//釋放舊Entry陣列的物件引用(for迴圈後,舊的Entry陣列不再引用任何物件)
            do {
                Entry<K,V> next = e.next;
                int i = indexFor(e.hash, newCapacity); //!!重新計算每個元素在陣列中的位置
                e.next = newTable[i]; //標記[1]
                newTable[i] = e;      //將元素放在陣列上
                e = next;             //訪問下一個Entry鏈上的元素
            } while (e != null);
        }
    }
}
複製程式碼

newTable[i] 的引用賦給了 e.next,也就是使用了單連結串列的頭插入方式,同一位置上新元素總會被放在連結串列的頭部位置;這樣先放在一個索引上的元素終會被放到 Entry 鏈的尾部(如果發生了 hash 衝突的話),這一點和 Jdk 1.8 有區別,下文詳解。在舊陣列中同一條 Entry 鏈上的元素,通過重新計算索引位置後,有可能被放到了新陣列的不同位置上。

下面舉個例子說明下擴容過程。假設了我們的 hash 演算法就是簡單的用 key mod(%) 一下表的大小(也就是陣列的長度)。其中的雜湊桶陣列 table 的 size =2, 所以 key = 3、7、5,put 順序依次為 5、7、3。在 mod(%) 2 以後都衝突在 table[1] 這裡了。這裡假設負載因子 loadFactor = 1,即當鍵值對的實際大小 size 大於 table 的實際大小時進行擴容。接下來的三個步驟是雜湊桶陣列 resize 成 4,然後所有的 Node 重新 rehash 的過程。

Java 進階必備:HashMap 原始碼分析

下面我們講解下 JDK1.8 做了哪些優化。經過觀測可以發現,我們使用的是 2 次冪的擴充套件(指長度擴為原來2倍),所以,元素的位置要麼是在原位置,要麼是在原位置再移動 2 次冪的位置。看下圖可以明白這句話的意思,n 為 table 的長度,圖(a)表示擴容前的 key1 和 key2 兩種key確定索引位置的示例,圖(b)表示擴容後 key1 和 key2 兩種 key 確定索引位置的示例,其中 hash1 是 key1 對應的雜湊與高位運算結果。

Java 進階必備:HashMap 原始碼分析

元素在重新計算 hash 之後,因為 n 變為 2 倍,那麼 n-1 的 mask 範圍在高位多 1bit(紅色),因此新的 index 就會發生這樣的變化:

Java 進階必備:HashMap 原始碼分析

因此,我們在擴充 HashMap 的時候,不需要像 JDK1.7 的實現那樣重新計算 hash,只需要看看原來的 hash 值新增的那個 bit 是 1 還是 0 就好了,是 0 的話索引沒變,是1的話索引變成“原索引+oldCap”,可以看看下圖為 16 擴充為 32 的 resize 示意圖:

Java 進階必備:HashMap 原始碼分析

這個設計確實非常的巧妙,既省去了重新計算 hash 值的時間,而且同時,由於新增的 1bit 是 0 還是 1 可以認為是隨機的,因此 resize 的過程,均勻的把之前的衝突的節點分散到新的 bucket 了。這一塊就是 JDK 1.8 新增的優化點。有一點注意區別,JDK 1.7 中 rehash 的時候,舊連結串列遷移新連結串列的時候,如果在新表的陣列索引位置相同,則連結串列元素會倒置,但是從上圖可以看出,JDK 1.8 不會倒置。有興趣的同學可以研究下 JDK 1.8 的 resize 原始碼,寫的很贊,如下:

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    // 如果 table 不為空,表明已經初始化過了
    if (oldCap > 0) {
        // 當 table 容量超超過最大值就不再擴充了,就只好隨你碰撞去吧
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 沒超過最大值,就擴充為原來的 2 倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    else if (oldThr > 0) // initial capacity was placed in threshold
        /*
         * 初始化時,將 threshold 的值賦值給 newCap,
         * HashMap 使用 threshold 變數暫時儲存 initialCapacity 引數的值
         */ 
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
         /*
         * 呼叫無參構造方法時,桶陣列容量為預設容量,
         * 閾值為預設容量與預設負載因子乘積
         */
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    // 計算新的 resize 上限
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
    // 建立新的桶陣列,桶陣列的初始化也是在這裡完成的
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    if (oldTab != null) {
        // 把每個 bucket 都移動到新的 buckets 中
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    // 重新對映時,需要對紅黑樹進行拆分
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    // 遍歷連結串列,並將連結串列節點按原順序進行分組
                    do {
                        next = e.next;
                        // 原索引
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        // 原索引 + oldCap
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    // 原索引放到 bucket 裡
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    // 原索引 + oldCap 放到 bucket 裡
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}
複製程式碼

get()

HashMap 的查詢操作比較簡單,查詢步驟與原理篇介紹一致,即先定位鍵值對所在的桶的位置,然後再對連結串列或紅黑樹進行查詢。通過這兩步即可完成查詢,該操作相關程式碼如下:

public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    // 1. 定位鍵值對所在桶的位置
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            // 2. 如果 first 是 TreeNode 型別,則呼叫黑紅樹查詢方法
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            // 3. 對連結串列進行查詢
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}
複製程式碼

remove()

HashMap 的刪除操作也很簡單,僅需三個步驟即可完成。第一步是定位桶位置,第二步遍歷連結串列並找到鍵值相等的節點,第三步刪除節點。相關原始碼如下:

public V remove(Object key) {
    Node<K,V> e;
    return (e = removeNode(hash(key), key, null, false, true)) == null ?
        null : e.value;
}

final Node<K,V> removeNode(int hash, Object key, Object value,
                           boolean matchValue, boolean movable) {
    Node<K,V>[] tab; Node<K,V> p; int n, index;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        // 1. 定位桶位置
        (p = tab[index = (n - 1) & hash]) != null) {
        Node<K,V> node = null, e; K k; V v;
        // 如果鍵的值與連結串列第一個節點相等,則將 node 指向該節點
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            node = p;
        else if ((e = p.next) != null) {  
            // 如果是 TreeNode 型別,呼叫紅黑樹的查詢邏輯定位待刪除節點
            if (p instanceof TreeNode)
                node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
            else {
                // 2. 遍歷連結串列,找到待刪除節點
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key ||
                         (key != null && key.equals(k)))) {
                        node = e;
                        break;
                    }
                    p = e;
                } while ((e = e.next) != null);
            }
        }
        
        // 3. 刪除節點,並修復連結串列或紅黑樹
        if (node != null && (!matchValue || (v = node.value) == value ||
                             (value != null && value.equals(v)))) {
            if (node instanceof TreeNode)
                ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
            else if (node == p)
                tab[index] = node.next;
            else
                p.next = node.next;
            ++modCount;
            --size;
            afterNodeRemoval(node);
            return node;
        }
    }
    return null;
}
複製程式碼

遍歷

和查詢一樣,遍歷操作也是大家使用頻率比較高的一個操作。對於 遍歷 HashMap,我們一般都會用下面的方式:

for(Object key : map.keySet()) {
    // do something
}
複製程式碼

for(HashMap.Entry entry : map.entrySet()) {
    // do something
}
複製程式碼

從上面程式碼片段中可以看出,大家一般都是對 HashMap 的 key 集合或 Entry 集合進行遍歷。上面程式碼片段中用 foreach 遍歷 keySet 方法產生的集合,在編譯時會轉換成用迭代器遍歷,等價於:

Set keys = map.keySet();
Iterator ite = keys.iterator();
while (ite.hasNext()) {
    Object key = ite.next();
    // do something
}
複製程式碼

大家在遍歷 HashMap 的過程中會發現,多次對 HashMap 進行遍歷時,遍歷結果順序都是一致的。但這個順序和插入的順序一般都是不一致的。

public Set<K> keySet() {
    Set<K> ks = keySet;
    if (ks == null) {
        ks = new KeySet();
        keySet = ks;
    }
    return ks;
}

final class KeySet extends AbstractSet<K> {
    public final int size()                 { return size; }
    public final void clear()               { HashMap.this.clear(); }
    public final Iterator<K> iterator()     { return new KeyIterator(); }
    public final boolean contains(Object o) { return containsKey(o); }
    public final boolean remove(Object key) {
        return removeNode(hash(key), key, null, false, true) != null;
    }
    // 省略部分程式碼
}

final class KeyIterator extends HashIterator
    implements Iterator<K> {
    public final K next() { return nextNode().key; }
}

abstract class HashIterator {
    Node<K,V> next;        // next entry to return
    Node<K,V> current;     // current entry
    int expectedModCount;  // for fast-fail
    int index;             // current slot

    HashIterator() {
        expectedModCount = modCount;
        Node<K,V>[] t = table;
        current = next = null;
        index = 0;
        if (t != null && size > 0) { // advance to first entry
            // 尋找第一個包含連結串列節點引用的桶
            do {} while (index < t.length && (next = t[index++]) == null);
        }
    }

    public final boolean hasNext() {
        return next != null;
    }

    final Node<K,V> nextNode() {
        Node<K,V>[] t;
        Node<K,V> e = next;
        if (modCount != expectedModCount)
            throw new ConcurrentModificationException();
        if (e == null)
            throw new NoSuchElementException();
        if ((next = (current = e).next) == null && (t = table) != null) {
            // 尋找下一個包含連結串列節點引用的桶
            do {} while (index < t.length && (next = t[index++]) == null);
        }
        return e;
    }

    public final void remove() {
        Node<K,V> p = current;
        if (p == null)
            throw new IllegalStateException();
        if (modCount != expectedModCount)
            throw new ConcurrentModificationException();
        current = null;
        K key = p.key;
        removeNode(hash(key), key, null, false, false);
        expectedModCount = modCount;
    }
}
複製程式碼

如上面的原始碼,遍歷所有的鍵時,首先要獲取鍵集合 KeySet 物件,然後再通過 KeySet 的迭代器 KeyIterator 進行遍歷。KeyIterator 類繼承自 HashIterator 類,核心邏輯也封裝在 HashIterator 類中。HashIterator 的邏輯並不複雜,在初始化時,HashIterator 先從桶陣列中找到包含連結串列節點引用的桶。然後對這個桶指向的連結串列進行遍歷。遍歷完成後,再繼續尋找下一個包含連結串列節點引用的桶,找到繼續遍歷。找不到,則結束遍歷。

參考資料

我的 Github

github.com/jeanboydev/…

我的公眾號

歡迎關注我的公眾號,分享各種技術乾貨,各種學習資料,職業發展和行業動態。

Android 波斯灣

相關文章