Redis的字典使用雜湊表作為底層實現,一個雜湊表中可以有多個雜湊表節點,而每個雜湊節點就儲存在字典中的一個鍵值對。
redis字典所用的雜湊表由disht結構定義。
typedef struct dictht{ dictEntry **table;//雜湊表陣列 unsigned long size;//雜湊表大小 unsigned long sizemask;//雜湊表大小掩碼,用於計算索引值 ,總是等於size -1 unsigned long used;//該雜湊表已有節點數量 }
table 屬性是一個陣列,陣列中的每個元素都是一個指向dictEntry結構的指標,每個dictEntry結構儲存著一個鍵值對。其他的屬性不多說。
雜湊表節點
雜湊表節點使用dictEntry結構標識,每個dictEntry儲存一個鍵值對。
typedef struct dictEntry{ void *key;//鍵 union{ void *val; uint64_tu64' int64_ts64' } v;//值 struct dictEntry *next;//指向下個雜湊節點,形成連結串列 } ductEntry;
*next 屬性是指向另一個雜湊表節點的指標,這個指標可以將多個雜湊值相同的鍵值對連線在一起,解決鍵衝突的問題。所以,每一個雜湊索引為一個單向連結串列。
Redis中的字典由dict結構表示:
typedef struct dict{ dictType *type;//型別特定函式 void *orivdata;//私有資料 dictht ht[2];//雜湊表 int trehashidx;//rehash 索引 ,當rehash不再進行時,值為-1 } dict;
Redis計算雜湊值和索引值的方法:
hash = dict->type->hashFunction(key);
index = hash & dict->ht[x].sizemask;
解決鍵衝突:
當兩個或兩個一個數量的鍵被分配到了雜湊表陣列的同一個索引上面時,為我們稱作這些鍵發生衝突。Redis的雜湊表使用鏈地址法來解決衝突,每個雜湊表節點的next指標構成了一個單向連結串列,以此來解決鍵衝突。
另外由於連結串列沒有指向連結串列結尾的指標,為考慮速度,每次將新加的節點放到連結串列表頭位置(複雜度為O(1))。
Rehash
隨著雜湊表儲存的鍵增多或減少,為了讓雜湊表的負載因子維持在一個合理的範圍內,程式會對雜湊表的小小進行rehash(重新雜湊)。
1、為字典表的ht[1]雜湊表分配空間,這個雜湊表的空間大小取決於要執行的操作以及ht[0]包含的鍵值對數量
(1)如果執行擴充套件,ht[1] =第一個>=ht[0].used * 2 的2的n次方冪。
(2)如果收縮 ht[1] = 第一個>=ht[0].used 的2的n次方冪
2、h[0] 遷移至h[1]。
3、清空h[0],將h[1]設定為h[0],新建h[1]。
漸進式rehash
字典表同時使用ht[0],ht[1],ht[0]通過索引計數器分批量的遷移至ht[1],為解決ht[0]所持有的鍵值對量太大的問題。
不為別的,每天學一點,總會有收穫。
說明:尊重作者智慧財產權,文中內容參考《Redis設計與實現》,僅在此做學習與大家分享。