HashMap、Hashtable、ConcurrentHashMap的原理與區別
下面直接來乾貨,先說這三個Map的區別:
HashTable
- 底層陣列+連結串列實現,無論key還是value都不能為null,執行緒安全,實現執行緒安全的方式是在修改資料時鎖住整個HashTable,效率低,ConcurrentHashMap做了相關優化
- 初始size為11,擴容:newsize = olesize*2+1
- 計算index的方法:index = (hash & 0x7FFFFFFF) % tab.length
HashMap
- 底層陣列+連結串列實現,可以儲存null鍵和null值,執行緒不安全
- 初始size為16,擴容:newsize = oldsize*2,size一定為2的n次冪
- 擴容針對整個Map,每次擴容時,原來陣列中的元素依次重新計算存放位置,並重新插入
- 插入元素後才判斷該不該擴容,有可能無效擴容(插入後如果擴容,如果沒有再次插入,就會產生無效擴容)
- 當Map中元素總數超過Entry陣列的75%,觸發擴容操作,為了減少連結串列長度,元素分配更均勻
- 計算index方法:index = hash & (tab.length – 1)
HashMap的初始值還要考慮載入因子:
- 雜湊衝突:若干Key的雜湊值按陣列大小取模後,如果落在同一個陣列下標上,將組成一條Entry鏈,對Key的查詢需要遍歷Entry鏈上的每個元素執行equals()比較。
- 載入因子:為了降低雜湊衝突的概率,預設當HashMap中的鍵值對達到陣列大小的75%時,即會觸發擴容。因此,如果預估容量是100,即需要設定100/0.75=134的陣列大小。
- 空間換時間:如果希望加快Key查詢的時間,還可以進一步降低載入因子,加大初始大小,以降低雜湊衝突的概率。
HashMap和Hashtable都是用hash演算法來決定其元素的儲存,因此HashMap和Hashtable的hash表包含如下屬性:
- 容量(capacity):hash表中桶的數量
- 初始化容量(initial capacity):建立hash表時桶的數量,HashMap允許在構造器中指定初始化容量
- 尺寸(size):當前hash表中記錄的數量
- 負載因子(load factor):負載因子等於“size/capacity”。負載因子為0,表示空的hash表,0.5表示半滿的雜湊表,依此類推。輕負載的雜湊表具有衝突少、適宜插入與查詢的特點(但是使用Iterator迭代元素時比較慢)
除此之外,hash表裡還有一個“負載極限”,“負載極限”是一個0~1的數值,“負載極限”決定了hash表的最大填滿程度。當hash表中的負載因子達到指定的“負載極限”時,hash表會自動成倍地增加容量(桶的數量),並將原有的物件重新分配,放入新的桶內,這稱為rehashing。
HashMap和Hashtable的構造器允許指定一個負載極限,HashMap和Hashtable預設的“負載極限”為0.75,這表明當該hash表的3/4已經被填滿時,hash表會發生rehashing。
“負載極限”的預設值(0.75)是時間和空間成本上的一種折中:
- 較高的“負載極限”可以降低hash表所佔用的記憶體空間,但會增加查詢資料的時間開銷,而查詢是最頻繁的操作(HashMap的get()與put()方法都要用到查詢)
- 較低的“負載極限”會提高查詢資料的效能,但會增加hash表所佔用的記憶體開銷
程式猿可以根據實際情況來調整“負載極限”值。
ConcurrentHashMap
- 底層採用分段的陣列+連結串列實現,執行緒安全
- 通過把整個Map分為N個Segment,可以提供相同的執行緒安全,但是效率提升N倍,預設提升16倍。(讀操作不加鎖,由於HashEntry的value變數是 volatile的,也能保證讀取到最新的值。)
- Hashtable的synchronized是針對整張Hash表的,即每次鎖住整張表讓執行緒獨佔,ConcurrentHashMap允許多個修改操作併發進行,其關鍵在於使用了鎖分離技術
- 有些方法需要跨段,比如size()和containsValue(),它們可能需要鎖定整個表而而不僅僅是某個段,這需要按順序鎖定所有段,操作完畢後,又按順序釋放所有段的鎖
- 擴容:段內擴容(段內元素超過該段對應Entry陣列長度的75%觸發擴容,不會對整個Map進行擴容),插入前檢測需不需要擴容,有效避免無效擴容
Hashtable和HashMap都實現了Map介面,但是Hashtable的實現是基於Dictionary抽象類的。Java5提供了ConcurrentHashMap,它是HashTable的替代,比HashTable的擴充套件性更好。
HashMap基於雜湊思想,實現對資料的讀寫。當我們將鍵值對傳遞給put()方法時,它呼叫鍵物件的hashCode()方法來計算hashcode,然後找到bucket位置來儲存值物件。當獲取物件時,通過鍵物件的equals()方法找到正確的鍵值對,然後返回值物件。HashMap使用連結串列來解決碰撞問題,當發生碰撞時,物件將會儲存在連結串列的下一個節點中。HashMap在每個連結串列節點中儲存鍵值對物件。當兩個不同的鍵物件的hashcode相同時,它們會儲存在同一個bucket位置的連結串列中,可通過鍵物件的equals()方法來找到鍵值對。如果連結串列大小超過閾值(TREEIFY_THRESHOLD,8),連結串列就會被改造為樹形結構。
在HashMap中,null可以作為鍵,這樣的鍵只有一個,但可以有一個或多個鍵所對應的值為null。當get()方法返回null值時,即可以表示HashMap中沒有該key,也可以表示該key所對應的value為null。因此,在HashMap中不能由get()方法來判斷HashMap中是否存在某個key,應該用containsKey()方法來判斷。而在Hashtable中,無論是key還是value都不能為null。
Hashtable是執行緒安全的,它的方法是同步的,可以直接用在多執行緒環境中。而HashMap則不是執行緒安全的,在多執行緒環境中,需要手動實現同步機制。
Hashtable與HashMap另一個區別是HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtable的enumerator迭代器不是fail-fast的。所以當有其它執行緒改變了HashMap的結構(增加或者移除元素),將會丟擲ConcurrentModificationException,但迭代器本身的remove()方法移除元素則不會丟擲ConcurrentModificationException異常。但這並不是一個一定發生的行為,要看JVM。
先看一下簡單的類圖:
從類圖中可以看出來在儲存結構中ConcurrentHashMap比HashMap多出了一個類Segment,而Segment是一個可重入鎖。
ConcurrentHashMap是使用了鎖分段技術來保證執行緒安全的。
鎖分段技術:首先將資料分成一段一段的儲存,然後給每一段資料配一把鎖,當一個執行緒佔用鎖訪問其中一個段資料的時候,其他段的資料也能被其他執行緒訪問。
ConcurrentHashMap提供了與Hashtable和SynchronizedMap不同的鎖機制。Hashtable中採用的鎖機制是一次鎖住整個hash表,從而在同一時刻只能由一個執行緒對其進行操作;而ConcurrentHashMap中則是一次鎖住一個桶。
ConcurrentHashMap預設將hash表分為16個桶,諸如get、put、remove等常用操作只鎖住當前需要用到的桶。這樣,原來只能一個執行緒進入,現在卻能同時有16個寫執行緒執行,併發效能的提升是顯而易見的。
相關文章
- HashMap、HashTable、ConcurrentHashMap的區別HashMap
- 集合類HashMap,HashTable,ConcurrentHashMap區別?HashMap
- HashTable與ConcurrentHashMap的區別HashMap
- HashMap底層實現原理/HashMap與HashTable區別/HashMap與HashSet區別HashMap
- HashTable、ConcurrentHashMap、TreeMap、HashMap關於鍵值的區別HashMap
- 10分鐘掌握ConcurrentHashMap 3分鐘清楚和HashMap、Hashtable的區別HashMap
- ConcurrentHashMap 與HashTableHashMap
- C#中Hashtable和HashMap的區別C#HashMap
- 五分鐘看懂Hashtable原始碼以及與HashMap的區別原始碼HashMap
- 一文讀懂JDK7,8,9的hashmap,hashtable,concurrenthashmap及他們的區別JDKHashMap
- java複習之HashMap和Hashtable的區別JavaHashMap
- HashMap為何執行緒不安全?HashMap,HashTable,ConcurrentHashMap對比HashMap執行緒
- 一文讀懂JDK1.7,JDK1.8,JDK1.9的hashmap,hashtable,concurrenthashmap及他們的區別JDKHashMap
- HashSet與HashMap的區別HashMap
- Java集合系列(四):HashMap、Hashtable、LinkedHashMap、TreeMap的使用方法及區別JavaHashMap
- Hashtable和HashMapHashMap
- 原始碼分析–ConcurrentHashMap與HashTable(JDK1.8)原始碼HashMapJDK
- Hashtable/HashMap與key/value為null的關係HashMapNull
- 【java】【Map】HashMap、Hashtable、CollectionsJavaHashMap
- 什麼是ConcurrentHashMap?不同JDK下ConcurrentHashMap的區別?HashMapJDK
- HashMap以及ConcurrentHashMap(volatile)HashMap
- HashMap、Hash Table、ConcurrentHashMapHashMap
- HashMap、LinkedHashMap、HashTable、HashSet筆記HashMap筆記
- Java集合詳解4:一文讀懂HashMap和HashTable的區別以及常見面試題JavaHashMap面試題
- HashMap 、ConcurrentHashMap知識點全解析HashMap
- Java中HashMap,LinkedHashMap,TreeMap的區別[轉]JavaHashMap
- hashmap和concurrenthashmap原始碼分析(1.7/1.8)HashMap原始碼
- bind、call、apply的區別與實現原理APP
- 徹底搞清楚ConcurrentHashMap的實現原理(含JDK1.7和JDK1.8的區別)HashMapJDK
- Java7/8中的HashMap和ConcurrentHashMap全解析JavaHashMap
- 三,TreeMap和HashMap,TreeSet和HashMap的區別以及方法使用上的不同HashMap
- ConcurrentHashMap底層原理HashMap
- Java集合--ConcurrentHashMap原理JavaHashMap
- HashMap與LinkedHashMap型別集合HashMap型別
- HashMap原理HashMap
- HashSet/HashMap、TreeSet/TreeMap、LinkedHashSet/LinkedHashMap 區別HashMap
- HashMap 實現原理與原始碼分析HashMap原始碼
- Java:HashMap原理與設計緣由JavaHashMap