為什麼 HashMap 的容量大小要設定為2的N次方？

壹言發表於2020-12-20

原文網址 : https://www.cnblogs.com/chxuan/p/14163087.html

原文連結：https://www.changxuan.top/?p=1208

前兩天，我在一位同學提交中看到了下面這樣的一行程式碼，讓我很是驚訝。

Map<String, String> temp = new HashMap<>(6);

我給他說，你這樣例項化 Map 物件不好用，他不服氣。我說小朋友：如果想指定 HashMap 物件的容量得用2的N次方。他說你這也沒用。我說，我這個有用，這樣才能充分利用分配的記憶體空間。他非和我試試，我說可以，不過得先一起看看原始碼。

什麼是HashMap？

在弄懂標題的問題之前，首先需要清楚 HashMap 的概念。HashMap 是基於雜湊表的 Map 介面的實現，執行緒不安全，且不保證對映順序。

HashMap 儲存資料依賴的是陣列和[連結串列|紅黑樹]，具體連結串列和紅黑樹之間如何轉換的細節此文不做詳細介紹。而本文開頭提到的例項化容量大小指的則是陣列的大小。

如何計算元素在陣列中所對應的下標？

首先計算元素的雜湊值，方法如下：

static final int hash(Object key) {
        int h;
     // h = key.hashCode();
     // h = h ^ (h >>> 16)
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

為什麼不直接使用 key.hashCode()的值，我們後面會提到。

計算出來雜湊值後，由於陣列容量相對來說較小肯定不能直接使用雜湊值當作索引值。所以需要使用雜湊值對陣列長度減一後的值取模。不過在在 HashMap 中可不是直接使用 % 運算子來操作的。為了提高效率，採用的是與運算的方式，程式碼如下：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
      // n 為陣列容量， (n-1) & hash 則是計算索引值
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
          ... ...
        }
}

既然清楚了計算元算在陣列中所對應下標的方法，那麼證明為什麼例項化 HashMap 物件的容量要使用2的N次方就簡單多了。

假如初始容量為2的3次方數字8，當雜湊值與容量大小減一的值進行與運算時可以保證結果比較均勻的分佈在陣列上。

  10100101 11000100 00100101
& 00000000 00000000 00000111 // 7
----------------------------------
  00000000 00000000 00000101 // 結果可以是[0,7]中的任一數字

如果初始容量為6，那麼出現雜湊衝突的機率就會增加了。

  10100101 11000100 00100101
& 00000000 00000000 00000101 // 5 
----------------------------------
  00000000 00000000 00000101 // 5
  
  10100101 11000100 00100111
& 00000000 00000000 00000101 // 5 
----------------------------------
  00000000 00000000 00000101 // 5

如果下面的值低位全是1，那麼上面的這次雜湊衝突則可以避免。那麼你想想，假如指定的容量大小為5又會怎麼樣呢？其實2的N次方數字-1的二進位制形式這個特性在好多地方會很好用，可以在小本本記上。

哦，前面說為什麼計算出來的雜湊值需要再讓高16位和低十六位做異或運算，主要是讓參與與運算的位同時具有高位和低位的特徵，來減少雜湊碰撞次數。

小朋友，還試不試啦！

hashMap 的size 為什麼是2的 n次方倍
2018-07-30
HashMap
HashMap的最大容量為什麼是2的30次方(1左移30)?
2018-10-18
HashMap
HashMap的table長度為什麼是2的n次
2024-04-04
HashMap
為什麼大公司要設定這麼高的門檻？
2019-01-16
為什麼hashtable不允許設定Null但是hashmap允許？
2020-10-30
NullHashMap
為什麼要虛擬化，為什麼要容器，為什麼要Docker，為什麼要K8S？
2023-01-16
DockerK8S
為什麼分庫分表使用2的N次方一個位元組用兩位16進位制
2019-02-19
cookie的值可以設定為中文嗎？為什麼？如果可以怎麼設定？
2024-12-09
Cookie
為什麼HashMap的鍵值可以為null，而ConcurrentHashMap不行？
2024-03-03
HashMapNull
為什麼 JavaScript 的 this 要這麼用？
2019-02-28
JavaScript
為什麼總是應該考慮給定 List 的初始大小
2022-12-13
(Java) 演算法題：2的N次方
2020-10-21
Java演算法
為什麼要成為「無敵」程式設計師？
2020-03-18
程式設計師
為什麼要進行域名解析？域名解析怎麼設定？
2022-04-25
Go 為什麼要設計 iota 常量？
2022-06-03
Go
為什麼不建議使用自定義Object作為HashMap的key？
2022-06-29
ObjectHashMap
為什麼要搭建自己的部落格
2020-11-21
為什麼 elasticsearch 的 JDBC 要收費
2021-11-16
ElasticsearchJDBC
Mysql：好好的索引，為什麼要下推？
2021-02-03
MySql索引
為什麼 JavaScript 要設計原型模式
2019-01-21
JavaScript原型模式
原始碼分析為什麼HashMap的table長度一定是2的整次冪
2020-12-04
原始碼HashMap
為什麼企業要採用以安全為中心的方法?
2022-06-14
為什麼要code review
2023-04-15
View
為什麼要寫作
2021-04-16
為什麼 Linux 預設頁大小是 4KB
2020-06-09
Linux
為什麼以a為底，n的對數（以b為底）為指數的冪等於以n為底，a的對數（以b 為底）為指數的冪？
2024-09-11
作為程式設計師為什麼要閱讀原始碼
2020-10-04
程式設計師原始碼
巨集定義裡面為什麼要加括號？
2022-03-19
給定一個大小為 n 的陣列，找到其中的眾數。眾數是指在陣列中出現次數大於 ⌊ n/2 ⌋ 的元素。
2019-03-20
陣列
Python 為什麼要保留顯式的 self ？
2020-04-06
Python
Angular 為什麼要引入 injection token 的概念
2021-10-17
Angular
中國程式設計師為什麼要跳槽？
2018-11-09
程式設計師
為什麼你永遠不應該在CSS中使用px來設定字型大小
2023-04-10
CSS
為什麼tcp的TIME_WAIT狀態要維持2MSL
2019-06-04
TCPAI
為什麼類裡面要定義靜態常量啊？
2019-08-27
企業應用程式為什麼要定製開發
2020-04-02
為什麼要學習 Julia
2019-03-03
為什麼要指令重排序？
2018-05-28
排序

為什麼 HashMap 的容量大小要設定為2的N次方？

什麼是HashMap？

如何計算元素在陣列中所對應的下標？

相關文章