Java中HashMap和TreeMap的區別深入理解

codeceo發表於2015-03-10

首先介紹一下什麼是Map。在陣列中我們是通過陣列下標來對其內容索引的,而在Map中我們通過物件來對物件進行索引,用來索引的物件叫做key,其對應的物件叫做value。這就是我們平時說的鍵值對。

HashMap通過hashcode對其內容進行快速查詢,而 TreeMap中所有的元素都保持著某種固定的順序,如果你需要得到一個有序的結果你就應該使用TreeMap(HashMap中元素的排列順序是不固定的)。

HashMap 非執行緒安全 TreeMap 非執行緒安全

執行緒安全

在Java裡,執行緒安全一般體現在兩個方面:

1、多個thread對同一個java例項的訪問(read和modify)不會相互干擾,它主要體現在關鍵字synchronized。如ArrayList和Vector,HashMap和Hashtable
(後者每個方法前都有synchronized關鍵字)。如果你在interator一個List物件時,其它執行緒remove一個element,問題就出現了。

2、每個執行緒都有自己的欄位,而不會在多個執行緒之間共享。它主要體現在java.lang.ThreadLocal類,而沒有Java關鍵字支援,如像static、transient那樣。

1.AbstractMap抽象類和SortedMap介面

AbstractMap抽象類:(HashMap繼承AbstractMap)覆蓋了equals()和hashCode()方法以確保兩個相等對映返回相同的雜湊碼。如果兩個對映大小相等、包含同樣的鍵且每個鍵在這兩個對映中對應的值都相同,則這兩個對映相等。對映的雜湊碼是對映元素雜湊碼的總和,其中每個元素是Map.Entry介面的一個實現。因此,不論對映內部順序如何,兩個相等對映會報告相同的雜湊碼。

SortedMap介面:(TreeMap繼承自SortedMap)它用來保持鍵的有序順序。SortedMap介面為映像的檢視(子集),包括兩個端點提供了訪問方法。除了排序是作用於對映的鍵以外,處理SortedMap和處理SortedSet一樣。新增到SortedMap實現類的元素必須實現Comparable介面,否則您必須給它的建構函式提供一個Comparator介面的實現。TreeMap類是它的唯一一份實現。

2.兩種常規Map實現

HashMap:基於雜湊表實現。使用HashMap要求新增的鍵類明確定義了hashCode()和equals()[可以重寫hashCode()和equals()],為了優化HashMap空間的使用,您可以調優初始容量和負載因子。

(1)HashMap(): 構建一個空的雜湊映像
(2)HashMap(Map m): 構建一個雜湊映像,並且新增映像m的所有對映
(3)HashMap(int initialCapacity): 構建一個擁有特定容量的空的雜湊映像
(4)HashMap(int initialCapacity, float loadFactor): 構建一個擁有特定容量和載入因子的空的雜湊映像

TreeMap:基於紅黑樹實現。TreeMap沒有調優選項,因為該樹總處於平衡狀態。

(1)TreeMap():構建一個空的映像樹
(2)TreeMap(Map m): 構建一個映像樹,並且新增映像m中所有元素
(3)TreeMap(Comparator c): 構建一個映像樹,並且使用特定的比較器對關鍵字進行排序
(4)TreeMap(SortedMap s): 構建一個映像樹,新增映像樹s中所有對映,並且使用與有序映像s相同的比較器排序

3.兩種常規Map效能

HashMap:適用於在Map中插入、刪除和定位元素。
Treemap:適用於按自然順序或自定義順序遍歷鍵(key)。

4.總結

HashMap通常比TreeMap快一點(樹和雜湊表的資料結構使然),建議多使用HashMap,在需要排序的Map時候才用TreeMap。

import java.util.HashMap; 
import java.util.Hashtable; 
import java.util.Iterator; 
import java.util.Map; 
import java.util.TreeMap; 
public class HashMaps { 
public static void main(String[] args) { 
Map<String, String> map = new HashMap<String, String>(); 
map.put("a", "aaa"); 
map.put("b", "bbb"); 
map.put("c", "ccc"); 
map.put("d", "ddd"); 
Iterator<String> iterator = map.keySet().iterator(); 
while (iterator.hasNext()) { 
Object key = iterator.next(); 
System.out.println("map.get(key) is :" + map.get(key)); 
} 
// 定義HashTable,用來測試 
Hashtable<String, String> tab = new Hashtable<String, String>(); 
tab.put("a", "aaa"); 
tab.put("b", "bbb"); 
tab.put("c", "ccc"); 
tab.put("d", "ddd"); 
Iterator<String> iterator_1 = tab.keySet().iterator(); 
while (iterator_1.hasNext()) { 
Object key = iterator_1.next(); 
System.out.println("tab.get(key) is :" + tab.get(key)); 
} 
TreeMap<String, String> tmp = new TreeMap<String, String>(); 
tmp.put("a", "aaa"); 
tmp.put("b", "bbb"); 
tmp.put("c", "ccc"); 
tmp.put("d", "cdc"); 
Iterator<String> iterator_2 = tmp.keySet().iterator(); 
while (iterator_2.hasNext()) { 
Object key = iterator_2.next(); 
System.out.println("tmp.get(key) is :" + tmp.get(key)); 
} 
} 
}

執行結果如下:

map.get(key) is :ddd
 map.get(key) is :bbb
 map.get(key) is :ccc
 map.get(key) is :aaa
 tab.get(key) is :bbb
 tab.get(key) is :aaa
 tab.get(key) is :ddd
 tab.get(key) is :ccc
 tmp.get(key) is :aaa
 tmp.get(key) is :bbb
 tmp.get(key) is :ccc
 tmp.get(key) is :cdc

HashMap的結果是沒有排序的,而TreeMap輸出的結果是排好序的。

下面就要進入本文的主題了。先舉個例子說明一下怎樣使用HashMap:

import java.util.*; 
public class Exp1 { 
public static void main(String[] args){ 
HashMap h1=new HashMap(); 
Random r1=new Random(); 
for (int i=0;i<1000;i++){ 
Integer t=new Integer(r1.nextInt(20)); 
if (h1.containsKey(t)) 
((Ctime)h1.get(t)).count++; 
else 
h1.put(t, new Ctime()); 
} 
System.out.println(h1); 
} 
} 
class Ctime{ 
int count=1; 
public String toString(){ 
return Integer.toString(count); 
} 
}

在HashMap中通過get()來獲取value,通過put()來插入value,ContainsKey()則用來檢驗物件是否已經存在。可以看出,和ArrayList的操作相比,HashMap除了通過key索引其內容之外,別的方面差異並不大。

前面介紹了,HashMap是基於HashCode的,在所有物件的超類Object中有一個HashCode()方法,但是它和equals方法一樣,並不能適用於所有的情況,這樣我們就需要重寫自己的HashCode()方法。下面就舉這樣一個例子:

import java.util.*; 
public class Exp2 { 
public static void main(String[] args){ 
HashMap h2=new HashMap(); 
for (int i=0;i<10;i++) 
h2.put(new Element(i), new Figureout()); 
System.out.println("h2:"); 
System.out.println("Get the result for Element:"); 
Element test=new Element(5); 
if (h2.containsKey(test)) 
System.out.println((Figureout)h2.get(test)); 
else 
System.out.println("Not found"); 
} 
} 
class Element{ 
int number; 
public Element(int n){ 
number=n; 
} 
} 
class Figureout{ 
Random r=new Random(); 
boolean possible=r.nextDouble()>0.5; 
public String toString(){ 
if (possible) 
return "OK!"; 
else 
return "Impossible!"; 
} 
}

在這個例子中,Element用來索引物件Figureout,也即Element為key,Figureout為value。在Figureout中隨機生成一個浮點數,如果它比0.5大,列印”OK!”,否則列印”Impossible!”。之後檢視Element(3)對應的Figureout結果如何。

結果卻發現,無論你執行多少次,得到的結果都是”Not found”。也就是說索引Element(3)並不在HashMap中。這怎麼可能呢?

原因得慢慢來說:Element的HashCode方法繼承自Object,而Object中的HashCode方法返回的HashCode對應於當前的地址,也就是說對於不同的物件,即使它們的內容完全相同,用HashCode()返回的值也會不同。這樣實際上違背了我們的意圖。因為我們在使用 HashMap時,希望利用相同內容的物件索引得到相同的目標物件,這就需要HashCode()在此時能夠返回相同的值。在上面的例子中,我們期望 new Element(i) (i=5)與 Elementtest=newElement(5)是相同的,而實際上這是兩個不同的物件,儘管它們的內容相同,但它們在記憶體中的地址不同。因此很自然的,上面的程式得不到我們設想的結果。下面對Element類更改如下:

class Element{ 
int number; 
public Element(int n){ 
number=n; 
} 
public int hashCode(){ 
return number; 
} 
public boolean equals(Object o){ 
return (o instanceof Element) && (number==((Element)o).number); 
} 
}

在這裡Element覆蓋了Object中的hashCode()和equals()方法。覆蓋hashCode()使其以number的值作為 hashcode返回,這樣對於相同內容的物件來說它們的hashcode也就相同了。而覆蓋equals()是為了在HashMap判斷兩個key是否相等時使結果有意義(有關重寫equals()的內容可以參考我的另一篇文章《重新編寫Object類中的方法》)。修改後的程式執行結果如下:

h2:
Get the result for Element:
Impossible!

請記住:如果你想有效的使用HashMap,你就必須重寫在其的HashCode()。

還有兩條重寫HashCode()的原則:
[list=1]

不必對每個不同的物件都產生一個唯一的hashcode,只要你的HashCode方法使get()能夠得到put()放進去的內容就可以了。即”不為一原則”。

生成hashcode的演算法儘量使hashcode的值分散一些,不要很多hashcode都集中在一個範圍內,這樣有利於提高HashMap的效能。即”分散原則”。至於第二條原則的具體原因,有興趣者可以參考Bruce Eckel的《Thinking in Java》,在那裡有對HashMap內部實現原理的介紹,這裡就不贅述了。

掌握了這兩條原則,你就能夠用好HashMap編寫自己的程式了。不知道大家注意沒有,java.lang.Object中提供的三個方法:clone(),equals()和hashCode()雖然很典型,但在很多情況下都不能夠適用,它們只是簡單的由物件的地址得出結果。這就需要我們在自己的程式中重寫它們,其實java類庫中也重寫了千千萬萬個這樣的方法。利用物件導向的多型性——覆蓋,Java的設計者很優雅的構建了Java的結構,也更加體現了Java是一門純OOP語言的特性。

相關文章