Redis資料結構三之壓縮列表

XHunter發表於2023-05-17

本文首發於公眾號:Hunter後端
原文連結:Redis資料結構三之壓縮列表

本篇筆記介紹壓縮列表。

在 Redis 3.2 版本之前,壓縮列表是列表物件、雜湊物件、有序集合物件的的底層實現之一。

因為壓縮列表本身結構上的一些缺陷,壓縮列表這個結構被替換了,但是壓縮列表結構本身有一些可取之處,並且替換它的新結構 listpack 與之很相似,所以我們這裡還是介紹一下壓縮列表的結構和儲存

1、壓縮列表的結構

壓縮列表是 Redis 為了節約記憶體而開發的,由一個連續記憶體塊組成的順序型資料結構。

它的組成結構如下:

| zlbytes | zltail | zllen | entry1 | entry2 | ... | entryN | zlend |

壓縮列表的英文名是 ziplist,所以它的屬性都是 zl 開頭。

1. 列表屬性介紹

zlbytes

zlbytes 長度為 4 位元組,記錄整個壓縮列表佔用的記憶體位元組數

zltail

zltail 長度為 4 位元組,記錄壓縮列表最後一個節點,也就是我們結構示例中的 entryN 到 zlbytes 的地址之間的偏移量。

zllen

zllen 長度為 2 位元組,記錄的是壓縮列表包含的節點數量,也就是結構中的 N。

zlend

zlend 長度為 1 位元組,它的值為 0xFF(十進位制 255),用於標記壓縮列表的末端。

2. 壓縮列表節點屬性介紹

對於每一個 entry 節點,也就是壓縮列表中的元素節點,它的結構示意如下:

| previous_entry_length | encoding | content |

previous_entry_length

previous_entry_length 屬性記錄的是壓縮列表中前一個節點的長度

previous_entry_length 屬性本身的長度可以是 1 位元組或者 5 位元組

如果前一節點的長度小於 254 位元組,那麼 previous_entry_length 屬性的長度為 1 位元組,前一個節點的長度儲存在這個位元組裡

如果前一節點的長度大於等於 254 位元組,那麼 previous_entry_length 屬性的長度為 5 位元組,第一個位元組被設定成 0xFE(也就是 254),之後的四個位元組用於前一節點的長度。

透過 previous_entry_length 屬性,我們可以透過當前節點的地址和 previous_entry_length 屬性,計算出前一個節點的起始地址,壓縮列表的從表尾到表頭的遍歷操作就是使用這個原理一個節點一個節點往前回溯實現的。

encoding

encoding 屬性記錄了節點的 content 屬性所儲存資料的型別以及長度。

encoding 的值如果是一位元組長,且值的最高位以 11 開頭,那麼表示是整數編碼,表示 content 屬性儲存著整數值。

encoding 的值為 一位元組、兩位元組、五位元組長,且值的最高位為 00、01、10 則表示是位元組陣列編碼

content

content 屬性儲存的是節點的值,可以是一個位元組陣列或者整數,值的型別和長度由節點的 encoding 屬性決定。

2、 連鎖更新

在壓縮列表的節點屬性中,previous_entry_length 屬性的長度是根據前一節點的長度來進行賦值的,如果前一節點的長度小於 254 位元組,那麼下一節點的 previous_entry_length 屬性長度為 1 位元組,如果前一節點的長度大於等於 254 位元組,那麼下一節點的 previous_entry_length 屬性為 5 位元組。

那麼在這種情況下,就存在一種較為極端的情況,那就是壓縮列表中每個節點的長度都在 250 - 253 位元組之間,這時候,如果在表頭插入一個長度大於等於 254 位元組的節點,那麼相對應的第二個節點的 previous_entry_length 的長度就要從 1 位元組變為 4 位元組,那麼該節點的整體長度就大於等於 254 位元組。

依此類推,壓縮列表的每一個節點的長度都會產生連鎖反應,長度都會逐個變成大於等於 254 位元組長度,程式就需要不斷地對壓縮列表執行空間重分配的操作。

Redis 將這種在特殊情況下產生的連續多次空間擴充套件操作稱為連鎖更新。

除了新增節點這種情況,還有一種刪除節點也可能造成連鎖更新的情況,比如有這麼幾個節點,big 節點的長度大於等於 254 位元組,small 節點長度小於254 位元組,e1 到 eN 的節點長度都在 250-253 位元組之間。

| zlbytes | zltail | zllen | big | small | entry1 | entry2 | ... | entryN | zlend |

這時候,刪除 small 節點,entry1 節點的前節點的長度就會從 250-253 變成大於等於 254,因此 entry1 節點的 previous_entry_length 長度就會變成 5 位元組,entry1 整體長度就會大於等於 254 位元組,依次之後每個節點都會這樣產生連鎖更新。

儘管連鎖更新的複雜度較高,但它真正造成效能問題的機率是很低的:

首先,壓縮列表裡要恰好有多個連續的、長度介於 250-253 位元組之間的節點,連鎖反應才有可能被引發

其次,即使出現連鎖更新,但只要被更新的節點數量不多,就不會對效能造成任何影響,比如對只擁有三五個節點的壓縮列表進行連鎖更新。

3、壓縮列表缺點

壓縮列表雖然能節約記憶體,但仍然存在一些缺點:

  • 需要透過遍歷操作來查詢節點,元素過多時會造成查詢效率低下
  • 對壓縮列表節點進行新增或者修改時,可能會造成連鎖更新的問題

如果想獲取更多後端相關文章,可掃碼關注閱讀:
image

相關文章