講講HashCode的作用

五月的倉頡發表於2015-09-27

前言

Object提供給我們了一個Native的方法“public native int hashCode();”,本文講講Hash是什麼以及HashCode的作用

 

Hash

先用一張圖看下什麼是Hash

Hash是雜湊的意思,就是把任意長度的輸入,通過雜湊演算法變換成固定長度的輸出,該輸出就是雜湊值。關於雜湊值,有以下幾個關鍵結論:

1、如果雜湊表中存在和雜湊原始輸入K相等的記錄,那麼K必定在f(K)的儲存位置上

2、不同關鍵字經過雜湊演算法變換後可能得到同一個雜湊地址,這種現象稱為碰撞

3、如果兩個Hash值不同(前提是同一Hash演算法),那麼這兩個Hash值對應的原始輸入必定不同

 

HashCode

然後講下什麼是HashCode,總結幾個關鍵點:

1、HashCode的存在主要是為了查詢的快捷性,HashCode是用來在雜湊儲存結構中確定物件的儲存地址的

2、如果兩個物件equals相等,那麼這兩個物件的HashCode一定也相同

3、如果物件的equals方法被重寫,那麼物件的HashCode方法也儘量重寫

4、如果兩個物件的HashCode相同,不代表兩個物件就相同,只能說明這兩個物件在雜湊儲存結構中,存放於同一個位置

 

HashCode有什麼用

回到最關鍵的問題,HashCode有什麼用?不妨舉個例子:

1、假設記憶體中有0 1 2 3 4 5 6 7 8這8個位置,如果我有個欄位叫做ID,那麼我要把這個欄位存放在以上8個位置之一,如果不用HashCode而任意存放,那麼當查詢時就需要到8個位置中去挨個查詢

2、使用HashCode則效率會快很多,把ID的HashCode%8,然後把ID存放在取得餘數的那個位置,然後每次查詢該類的時候都可以通過ID的HashCode%8求餘數直接找到存放的位置了

3、如果ID的HashCode%8算出來的位置上本身已經有資料了怎麼辦?這就取決於演算法的實現了,比如ThreadLocal中的做法就是從算出來的位置向後查詢第一個為空的位置,放置資料;HashMap的做法就是通過鏈式結構連起來。反正,只要保證放的時候和取的時候的演算法一致就行了。

4、如果ID的HashCode%8相等怎麼辦(這種對應的是第三點說的鏈式結構的場景)?這時候就需要定義equals了。先通過HashCode%8來判斷類在哪一個位置,再通過equals來在這個位置上尋找需要的類。對比兩個類的時候也差不多,先通過HashCode比較,假如HashCode相等再判斷equals。如果兩個類的HashCode都不相同,那麼這兩個類必定是不同的

舉個實際的例子Set。我們知道Set裡面的元素是不可以重複的,那麼如何做到?Set是根據equals()方法來判斷兩個元素是否相等的。比方說Set裡面已經有1000個元素了,那麼第1001個元素進來的時候,最多可能呼叫1000次equals方法,如果equals方法寫得複雜,對比的東西特別多,那麼效率會大大降低。使用HashCode就不一樣了,比方說HashSet,底層是基於HashMap實現的,先通過HashCode取一個模,這樣一下子就固定到某個位置了,如果這個位置上沒有元素,那麼就可以肯定HashSet中必定沒有和新新增的元素equals的元素,就可以直接存放了,都不需要比較;如果這個位置上有元素了,逐一比較,比較的時候先比較HashCode,HashCode都不同接下去都不用比了,肯定不一樣,HashCode相等,再equals比較,沒有相同的元素就存,有相同的元素就不存。如果原來的Set裡面有相同的元素,只要HashCode的生成方式定義得好(不重複),不管Set裡面原來有多少元素,只需要執行一次的equals就可以了。這樣一來,實際呼叫equals方法的次數大大降低,提高了效率。

 

為什麼重寫Object的equals(Object obj)方法儘量要重寫Object的hashCode()方法

我們在重寫Object的equals(Object obj)方法的時候,應該儘量重寫hashCode()方法,這是有原因的,下面詳細解釋下:

 1 public class HashCodeClass
 2 {
 3     private String str0;
 4     private double dou0;
 5     private int       int0;
 6     
 7     public boolean equals(Object obj)
 8     {
 9         if (obj instanceof HashCodeClass)
10         {
11             HashCodeClass hcc = (HashCodeClass)obj;
12             if (hcc.str0.equals(this.str0) && 
13                 hcc.dou0 == this.dou0 &&
14                 hcc.int0 == this.int0)
15             {
16                 return true;
17             }
18             return false;
19         }
20         return false;
21     }
22 }
 1 public class TestMain
 2 {
 3     public static void main(String[] args)
 4     {
 5         System.out.println(new HashCodeClass().hashCode());
 6         System.out.println(new HashCodeClass().hashCode());
 7         System.out.println(new HashCodeClass().hashCode());
 8         System.out.println(new HashCodeClass().hashCode());
 9         System.out.println(new HashCodeClass().hashCode());
10         System.out.println(new HashCodeClass().hashCode());
11     }
12 }

列印出來的值是:

1901116749
1807500377
355165777
1414159026
1569228633
778966024

我們希望兩個HashCodeClass類equals的前提是兩個HashCodeClass的str0、dou0、int0分別相等。OK,那麼這個類不重寫hashCode()方法是有問題的。

現在我的HashCodeClass都沒有賦初值,那麼這6個HashCodeClass應該是全部equals的。如果以HashSet為例,HashSet內部的HashMap的table本身的大小是16,那麼6個HashCode對16取模分別為13、9、1、2、9、8。第一個放入table[13]的位置、第二個放入table[9]的位置、第三個放入table[1]的位置。。。但是明明是全部equals的6個HashCodeClass,怎麼能這麼做呢?HashSet本身要求的就是equals的物件不重複,現在6個equals的物件在集合中卻有5份(因為有兩個計算出來的模都是9)。

那麼我們該怎麼做呢?重寫hashCode方法,根據str0、dou0、int0搞一個演算法生成一個儘量唯一的hashCode,這樣就保證了str0、dou0、int0都相等的兩個HashCodeClass它們的HashCode是相等的,這就是重寫equals方法必須儘量要重寫hashCode方法的原因。看下JDK中的一些類,都有這麼做:

Integer的

 1 public int hashCode() {
 2     return value;
 3     }
 4 
 5 public boolean equals(Object obj) {
 6     if (obj instanceof Integer) {
 7         return value == ((Integer)obj).intValue();
 8     }
 9     return false;
10     }

String的

 1 public int hashCode() {
 2     int h = hash;
 3     if (h == 0) {
 4         int off = offset;
 5         char val[] = value;
 6         int len = count;
 7 
 8             for (int i = 0; i < len; i++) {
 9                 h = 31*h + val[off++];
10             }
11             hash = h;
12         }
13         return h;
14     }
15 
16 public boolean equals(Object anObject) {
17     if (this == anObject) {
18         return true;
19     }
20     if (anObject instanceof String) {
21         String anotherString = (String)anObject;
22         int n = count;
23         if (n == anotherString.count) {
24         char v1[] = value;
25         char v2[] = anotherString.value;
26         int i = offset;
27         int j = anotherString.offset;
28         while (n-- != 0) {
29             if (v1[i++] != v2[j++])
30             return false;
31         }
32         return true;
33         }
34     }
35     return false;
36     }

HashMap中的實體類Entry

public final int hashCode() {
            return (key==null   ? 0 : key.hashCode()) ^
                   (value==null ? 0 : value.hashCode());
        }

public final boolean equals(Object o) {
            if (!(o instanceof Map.Entry))
                return false;
            Map.Entry e = (Map.Entry)o;
            Object k1 = getKey();
            Object k2 = e.getKey();
            if (k1 == k2 || (k1 != null && k1.equals(k2))) {
                Object v1 = getValue();
                Object v2 = e.getValue();
                if (v1 == v2 || (v1 != null && v1.equals(v2)))
                    return true;
            }
            return false;
        }

相關文章