Go語言map的底層實現

RyuGou發表於2018-09-29

map是Go語言中基礎的資料結構,在日常的使用中經常被用到。但是它底層是如何實現的呢?

map的整體結構圖

Golang中map的底層實現是一個雜湊表,因此實現map的過程實際上就是實現散表的過程。在這個雜湊表中,主要出現的結構體有兩個,一個叫hmap(a header for a go map),一個叫bucket。這兩種結構的樣子分別如下所示:

hmap:

Go語言map的底層實現

圖中有很多欄位,但是便於理解map的架構,你只需要關心的只有一個,就是標紅的欄位:buckets陣列。Golang的map中用於儲存的結構是bucket陣列。而bucket(即bmap)的結構是怎樣的呢?

bucket:

Go語言map的底層實現

相比於hmap,bucket的結構顯得簡單一些,標紅的欄位依然是“核心”,我們使用的map中的key和value就儲存在這裡。“高位雜湊值”陣列記錄的是當前bucket中key相關的“索引”,稍後會詳細敘述。還有一個欄位是一個指向擴容後的bucket的指標,使得bucket會形成一個連結串列結構。例如下圖:

Go語言map的底層實現

由此看出hmapbucket的關係是這樣的:

這裡寫圖片描述

而bucket又是一個連結串列,所以,整體的結構應該是這樣的:

這裡寫圖片描述

雜湊表的特點是會有一個雜湊函式,對你傳來的key進行雜湊運算,得到唯一的值,一般情況下都是一個數值。Golang的map中也有這麼一個雜湊函式,也會算出唯一的值,對於這個值的使用,Golang也是很有意思。

Golang把求得的值按照用途一分為二:高位和低位。

這裡寫圖片描述

如圖所示,藍色為高位,紅色為低位。 然後低位用於尋找當前key屬於hmap中的哪個bucket,而高位用於尋找bucket中的哪個key。上文中提到:bucket中有個屬性欄位是“高位雜湊值”陣列,這裡存的就是藍色的高位值,用來宣告當前bucket中有哪些“key”,便於搜尋查詢。 需要特別指出的一點是:我們map中的key/value值都是存到同一個陣列中的。陣列中的順序是這樣的:

這裡寫圖片描述

並不是key0/value0/key1/value1的形式,這樣做的好處是:在key和value的長度不同的時候,可以消除padding帶來的空間浪費。

現在,我們可以得到Go語言map的整個的結構圖了:

這裡寫圖片描述

以上,就是Go語言map的整體結構了。

map的擴容

當以上的雜湊表增長的時候,Go語言會將bucket陣列的數量擴充一倍,產生一個新的bucket陣列,並將舊陣列的資料遷移至新陣列。

載入因子

判斷擴充的條件,就是雜湊表中的載入因子(即loadFactor)。

載入因子是一個閾值,一般表示為:雜湊包含的元素數 除以 位置總數。是一種“產生衝突機會”和“空間使用”的平衡與折中:載入因子越小,說明空間空置率高,空間使用率小,但是載入因子越大,說明空間利用率上去了,但是“產生衝突機會”高了。

每種雜湊表的都會有一個載入因子,數值超過載入因子就會為雜湊表擴容。 Golang的map載入因子的公式是:map長度 / 2^B閾值是6.5。其中B可以理解為已擴容的次數。

當Go的map長度增長到大於載入因子所需的map長度時,Go語言就會將產生一個新的bucket陣列,然後把舊的bucket陣列移到一個屬性欄位oldbucket中。注意:並不是立刻把舊的陣列中的元素轉義到新的bucket當中,而是,只有當訪問到具體的某個bucket的時候,會把bucket中的資料轉移到新的bucket中。

如下圖所示:當擴容的時候,Go的map結構體中,會儲存舊的資料,和新生成的陣列

這裡寫圖片描述

上面部分代表舊的有資料的bucket,下面部分代表新生成的新的bucket。藍色代表存有資料的bucket,橘黃色代表空的bucket。 擴容時map並不會立即把新資料做遷移,而是當訪問原來舊bucket的資料的時候,才把舊資料做遷移,如下圖:

這裡寫圖片描述

注意:這裡並不會直接刪除舊的bucket,而是把原來的引用去掉,利用GC清除記憶體。

map中資料的刪除

如果理解了map的整體結構,那麼查詢、更新、刪除的基本步驟應該都很清楚了。這裡不再贅述。 值得注意的是,找到了map中的資料之後,針對key和value分別做如下操作:

1、如果``key``是一個指標型別的,則直接將其置為空,等待GC清除;
2、如果是值型別的,則清除相關記憶體。
3、同理,對``value``做相同的操作。
4、最後把key對應的高位值對應的陣列index置為空。
複製程式碼

更多精彩內容,請關注我的微信公眾號 網際網路技術窩 或者加微信共同探討交流:

Go語言map的底層實現

相關文章