JDK1.8 hashMap原始碼分析

weixin_34104341發表於2020-04-07

預設初始容量為16

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

最大容量為2^30

static final int MAXIMUM_CAPACITY = 1 << 30;

預設負載因子為0.75f

static final float DEFAULT_LOAD_FACTOR = 0.75f;
THRESHOLD 閥值,臨界值,hashmap實際容量達到閥值後進行擴容。

hashMap的建構函式
1.無參構造,使用預設的初始容量16,預設的負載因子0.75f
   public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

  2.指定初始容量

    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

  3.指定初始容量和負載因子,如果指定的初始容量大於支援的最大容量2^30次方則重設初始容量為2^30次方。

    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);  // jdk1.7此處 threshold = initialCapacity;閥值直接等於初始容量,會在第一次put時重設閥值。
    }

  然後設定閥值

    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

對設定的初始容量加一後進行一系列的右移然後或運算,如設定初始容量為9,結果為16,設定初始容量為16,則結果為16。也就是說找到 小於等於(n-1)*2的最大的2的次方的值。

所以如果不指定初始容量,則初始容量和閥值都為16。

  4.直接根據接收一個map的建構函式建立map

    public HashMap(Map<? extends K, ? extends V> m) {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        putMapEntries(m, false);
    }

put方法,才初始化node陣列

    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
     // transient Node<K,V>[] table; 如果node陣列沒有初始化則進行一個resize。
if ((tab = table) == null || (n = tab.length) == 0)
      //對陣列執行擴容操作。 n
= (tab = resize()).length;
      // 對陣列長度減一和key的hash值進行與運算得到陣列下標,查詢此下標是否有值。
if ((p = tab[i = (n - 1) & hash]) == null)
      // 沒值就新建一個node將key,value放在此下標上 tab[i]
= newNode(hash, key, value, null); else {
      // 運算得到的陣列對應的下標已經有值了,則判斷已經存在的值的key和將要儲存的key是否都相同 Node
<K,V> e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
          // 如果相同,則將舊值p賦給e e
= p; else if (p instanceof TreeNode)
          // 如果舊值是一個樹結點,則將新值放進這個紅黑樹中。 e
= ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else {
          // 是連結串列結構
for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) {
              // 將新的key,value放在連結的新的節點上 p.next
= newNode(hash, key, value, null);
              // TREEIFY_THRESHOLD =8,如果連結串列的長度為8,則轉為紅黑樹。
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }

resize方法:在第一次put元素的時候就執行一次。final Node<K,V>[] resize()         Node<K,V>[] oldTab = table;

      //第一次put時table為null
        int oldCap = (oldTab == null) ? 0 : oldTab.length;  // 舊的node陣列的長度
        int oldThr = threshold;  // 舊的閥值
        int newCap, newThr = 0; 
        if (oldCap > 0) {
      // 如果舊的陣列的長度大於2^30次方,則舊的閥值為int型的最大值即為2^31次方
if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; }
        // 新的陣列的長度為舊的陣列長度的兩倍,如果舊的陣列的長度的兩倍小於最大容量2^30,且舊的陣列的長度大於等於預設初始容量16,則新的閥值為舊的閥值的兩倍。
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold }
      //如果舊的閥值大於0,且node陣列沒有初始化,即剛建立hashMap,且指定了初始容量。第一次put。則,新的容量等於舊的閥值
else if (oldThr > 0) // initial capacity was placed in threshold newCap = oldThr; // 16 else {
// zero initial threshold signifies using defaults
        // 即建立HashMap用的是無參構造,還未初始化陣列,則設定陣列長度為預設容量16,閥值為預設負載因子0.75f*16=12
newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); }
    // 只有在用hashmap的帶參構造建立map且第一次put陣列沒有初始化時。此時新陣列的長度為建立map時的閥值。
if (newThr == 0) {
       // 修改建立map時賦的閥值,為其自身的0.75.而這時建立的陣列的長度為建立map時賦的閥值,如建立時指定了初始容量為9,則會建立一個初始容量為16的陣列,後將閥值設為12.
float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; if (oldTab != null) { for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { oldTab[j] = null; if (e.next == null) newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { // preserve order Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; do { next = e.next; if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); if (loTail != null) { loTail.next = null; newTab[j] = loHead; } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab; }

建立紅黑樹替換之前的連結串列

  /**
     * Replaces all linked nodes in bin at index for given hash unless
     * table is too small, in which case resizes instead.
     */
    final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            TreeNode<K,V> hd = null, tl = null;
            do {
                TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
                hd.treeify(tab);
        }
    }

 

1.7和1.8的區別

1、(無參構造不同)1.8的無參構造沒有初始化閥值,在第一次put時如果閥值未初始化的話才設陣列的容量為預設初始容量,閥值為容量的0.75。1.7的無參構造和帶參構造都指定了了閥值等於初始容量。

2、(帶參構造的初始閥值不同)用帶參構造的話1.7的閥值等於初始容量,第一次put時設為f(n)*0.75。1.8用帶參構造建立map時,閥值為f(n)即小於等於(n-1)*2的最大的2的次方的值,n為指定的初始容量或為預設初始容量

3、(陣列長度的值來源不同,但結果相同)1.7和1.8都是在第一次put時初始化陣列。不同的是1.7直接將陣列的長度設為了f(n),將閥值設為了長度的0.75。1.8是在第一次put中的resize中初始化陣列,如果是帶參構造建立的map則將初始閥值設為陣列的長度,再修改閥值為其自身的0.75

4、(資料結構不同)1.7的資料結構為陣列+連結串列。1.8的資料結構為陣列+連結串列+紅黑樹。當連結串列的長度大於8時,將連結串列修改為紅黑樹,將原來連結串列資料複製進去

5、(resize方法不同)1.8陣列未初始化時也是通過resize進行初始化的

未完待續...

轉載於:https://www.cnblogs.com/yangyongjie/p/10644515.html

相關文章