Redis核心技術筆記11-15

IT小馬發表於2023-01-11

11 String

為什麼String型別記憶體開銷大

RedisObject 結構體 + SDS:

  • 當儲存64位有符號整數時,String會存為一個8位元組的Long型別整數,稱為int編碼方式
  • 當資料包含字串時,String型別會用簡單動態字串(SDS)結構體來儲存

    • buf:位元組陣列,儲存實際資料。為了表示位元組陣列的結束,Redis 會自動在陣列最後加一個“\0”,這就會額外佔用 1 個位元組的開銷。
    • len:佔 4 個位元組,表示 buf 的已用長度。
    • alloc:也佔個 4 位元組,表示 buf 的實際分配長度,一般大於 len。

RedisObject

Redis 的資料型別有很多,而且,不同資料型別都有些相同的後設資料要記錄(比如最後一次訪問的時間、被引用的次數等),所以,Redis 會用一個 RedisObject 結構體來統一記錄這些後設資料,同時指向實際資料。

一個 RedisObject 包含了 8 位元組的後設資料和一個 8 位元組指標,這個指標再進一步指向具體資料型別的實際資料所在。

編碼方式

  • 儲存 Long 型別整數時,RedisObject 中的指標就直接賦值為整數資料了,只佔用8位元組。
  • 儲存小於等於 44 位元組的字串時,RedisObject 中的後設資料、指標和 SDS 是一塊連續的記憶體區域,可以避免記憶體碎片。這種佈局方式也被稱為 embstr 編碼方式。
  • 儲存大於44位元組的字串時,Redis會給SDS獨立的空間,用指標指向SDS結構,稱為raw編碼方式。

記憶體分配庫jemalloc

Redis 會使用一個全域性雜湊表儲存所有鍵值對,雜湊表的每一項是一個 dictEntry 的結構體,用來指向一個鍵值對。dictEntry 結構中有三個 8 位元組的指標,分別指向 key、value 以及下一個 dictEntry,三個指標共 24 位元組。

jemalloc 在分配記憶體時,會根據我們申請的位元組數 N,找一個比 N 大,但是最接近 N 的 2 的冪次數作為分配的空間,這樣可以減少頻繁分配的次數。

申請 24 位元組空間,jemalloc 則會分配 32 位元組。所以,在我們剛剛說的場景裡,dictEntry 結構就佔用了 32 位元組。

示例:10位數圖片ID和物件ID存為String型別時,記憶體結構:
RedisObject:8(後設資料)+ 8(INT)= 16位元組
雜湊表:8(key) + 8(value) + 8(next) = 24位元組 =>jemalloc 分配32位元組
總計: 16 * 2(鍵值對) + 32 = 64位元組

壓縮列表ziplist

壓縮列表之所以能節省記憶體,就在於它是用一系列連續的 entry 儲存資料。

  • 表頭:zlbytes(列表長度)、zltail(列表尾偏移量)、zllen(列表entry個數)
  • 後設資料:連續的entry
  • 表尾:zlend(列表結束)

每個entry構成:

  • prev_len:前一個entry的長度,小於254位元組時佔1位元組,否則佔5位元組。
  • len:表示自身長度,4 位元組;
  • encoding:記錄該節點content屬性儲存資料的型別及長度。小於等於63位元組佔1位元組,小於等於16383位元組佔2位元組,否則佔5位元組。
  • content:實際資料

Redis 基於壓縮列表實現了 List、Hash 和 Sorted Set 這樣的集合型別,這樣做的最大好處就是節省了 dictEntry 的開銷。

  • 當你用 String 型別時,一個鍵值對就有一個 dictEntry,要用 32 位元組空間。
  • 採用集合型別時,一個 key 就對應一個集合的資料,能儲存的資料多了很多,但也只用了一個 dictEntry,這樣就節省了記憶體。

集合型別如何儲存單值的鍵值對

可以採用基於 Hash 型別的二級編碼方法:
把一個單值的資料拆分成兩部分,前一部分作為 Hash 集合的 key,後一部分作為 Hash 集合的 value,這樣一來,我們就可以把單值資料儲存到 Hash 集合中了。

每個 entry 儲存一個圖片儲存物件 ID(8 位元組),此時,每個 entry 的 prev_len 只需要 1 個位元組就行,因為每個 entry 的前一個 entry 長度都只有 8 位元組,小於 254 位元組。這樣一來,一個圖片的儲存物件 ID 所佔用的記憶體大小是 14 位元組(1+ 4 + 1 + 8),實際分配 16 位元組。新增一個圖片:一個entry(16位元組)

Hash型別的底層實現

Redis Hash 型別的兩種底層實現結構,壓縮列表和雜湊表,都在什麼時候使用呢?
Hash 型別設定了用壓縮列表儲存資料時的兩個閾值,一旦超過了閾值,Hash 型別就會用雜湊表來儲存資料了。

  • hash-max-ziplist-entries:表示用壓縮列表儲存時雜湊集合中的最大元素個數。
  • hash-max-ziplist-value:表示用壓縮列表儲存時雜湊集合中單個元素的最大長度。

一旦從壓縮列表轉為了雜湊表,Hash 型別就會一直用雜湊表進行儲存,而不會再轉回壓縮列表了。

以圖片 ID 1101000060 和圖片儲存物件 ID 3302000080 為例,我們可以把圖片 ID 的前 7 位(1101000)作為 Hash 型別的鍵,把圖片 ID 的最後 3 位(060)和圖片儲存物件 ID 分別作為 Hash 型別值中的 key 和 value。

為了能充分使用壓縮列表的精簡記憶體佈局,我們一般要控制儲存在 Hash 集合中的元素個數。所以,在剛才的二級編碼中,我們只用圖片 ID 最後 3 位作為 Hash 集合的 key,也就保證了 Hash 集合的元素個數不超過 1000,同時,我們把 hash-max-ziplist-entries 設定為 1000,這樣一來,Hash 集合就可以一直使用壓縮列表來節省記憶體空間了。

小結

在儲存的鍵值對本身佔用的記憶體空間不大時,String 型別的後設資料開銷就佔據主導了,這裡麵包括了 RedisObject 結構、SDS 結構、dictEntry 結構的記憶體開銷。

針對這種情況,我們可以使用壓縮列表儲存資料。

使用 Hash 這種集合型別儲存單值鍵值對的資料時,我們需要將單值資料拆分成兩部分,分別作為 Hash 集合的鍵和值。

Redis容量預估網址:http://www.redis.cn/redis_mem...

12 集合統計模式

集合型別常見的四種統計模式,包括聚合統計、排序統計、二值狀態統計和基數統計。

聚合統計(Set集合)

聚合統計,就是指統計多個集合元素的聚合結果,包括:

  • 統計多個集合的共有元素(交集統計);
  • 把兩個集合相比,統計其中一個集合獨有的元素(差集統計);
  • 統計多個集合的所有元素(並集統計)。

示例:記錄每天登入使用者ID,統計累計使用者,新增使用者,留存使用者。
key 是 user:id 以及當天日期,例如 user20200803;
value 是 Set 集合,記錄當天登入的使用者 ID。

累計使用者:統計user:id和user20200803的並集,儲存到user:id中

SUNIONSTORE  user:id  user:id  user:id:20200803 

新增使用者:統計user20200804和user:id的差集,儲存到user:new中

SDIFFSTORE  user:new  user:id:20200804 user:id  

留存使用者:統計0803和0804的交集,儲存到userrem

SINTERSTORE user:id:rem user:id:20200803 user:id:20200804

Set集合聚合統計風險: 計算複雜度高,資料量大時直接執行計算會導致Redis例項阻塞。
解決方案:

  1. 選一個從庫負責聚合運算
  2. 把資料讀取到客戶端,在客戶端完成聚合統計

排序統計

集合中的元素可以按序排列,這種對元素保序的集合型別叫作有序集合。

Redis集合型別:List,Hash,Set,Sorted Set
有序集合型別:

  • List:按照元素進入 List 的順序進行排序
  • Sorted Set:根據元素權重排序

List問題:List是透過元素位置來排序的,新元素插入後元素位置會改變,分頁操作時,Lrange可能讀取到舊資料。

所以,在面對需要展示最新列表、排行榜等場景時,如果資料更新頻繁或者需要分頁顯示,建議你優先考慮使用 Sorted Set。

二值狀態統計

在簽到統計時,每個使用者一天的簽到用 1 個 bit 位就能表示,一個月(假設是 31 天)的簽到情況用 31 個 bit 位就可以,而一年的簽到也只需要用 365 個 bit 位,根本不用太複雜的集合型別。這個時候,我們就可以選擇 Bitmap。

Bitmap 本身是用 String 型別作為底層資料結構實現的一種統計二值狀態的資料型別。

Bitmap可以看做一個bit陣列,提供GETBIT/SETBIT操作,使用偏移值offset對bitmap陣列進行讀寫,offset最小值為0。

  • BITSET後該bit位設定為1;
  • BITCOUNT統計所有為1的個數
  • BITOP按位與

示例:統計8月3日簽到數(3日:0-1-2)

SETBIT uid:sign:3000:202008 2 1 
GETBIT uid:sign:3000:202008 2
BITCOUNT uid:sign:3000:202008

如果只需要統計資料的二值狀態,例如商品有沒有、使用者在不在等,就可以使用 Bitmap,因為它只用一個 bit 位就能表示 0 或 1。在記錄海量資料時,Bitmap 能夠有效地節省記憶體空間。

基數統計

基數統計就是指統計一個集合中不重複的元素個數。

在 Redis 的集合型別中,Set 型別預設支援去重。

HyperLogLog 是一種用於統計基數的資料集合型別,它的最大優勢就在於,當集合元素數量非常多時,它計算基數所需的空間總是固定的,而且還很小。

示例:統計訪問頁面UV

PFADD page1:uv user1 user2 user3 user4 user5
PFCOUNT page1:uv

HyperLogLog 的統計規則是基於機率完成的,所以它給出的統計結果是有一定誤差的,標準誤算率是 0.81%。

小結

集合型別優缺點:

其他統計場景:

  1. 使用Sorted Set統計線上使用者數:

    • 使用者上線時使用zadd online_users $timestamp $user_id把使用者新增到Sorted Set中
    • 使用zcount online_users $starttime $endtime就可以得出指定時間段內的線上使用者數
  2. 使用Set記錄使用者喜歡水果,如sadd user1 apple banana ,再使用zunionstore fruits_union 2 user1 user2把結果儲存到fruits_union這個key中,zrange fruits_union 0 -1 withscores可以得出每種水果被喜歡的次數。

13 GEO

位置資訊服務(Location-Based Service,LBS)應用訪問的資料是和人或物關聯的一組經緯度資訊,而且要能查詢相鄰的經緯度範圍,GEO 就非常適合應用在 LBS 服務的場景中。

對於一個 LBS 應用來說,除了記錄經緯度資訊,還需要根據使用者的經緯度資訊在車輛的 Hash 集合中進行範圍查詢。

實際上,GEO 型別的底層資料結構就是用 Sorted Set 來實現的,元素是車輛 ID,元素的權重分數是GeoHash編碼過的經緯度資訊。

GeoHash編碼

二分割槽間,區間編碼。
即先對經度和緯度分別編碼,然後再把經緯度各自的編碼組合成一個最終編碼。

GeoHash 編碼會把值編碼成一個 N 位的二進位制值,經度範圍[-180,180],緯度範圍[-90,90]做 N 次的二分割槽操作,其中 N 可以自定義。編碼值落在左分割槽,我們就用 0 表示;如果落在右分割槽,就用 1 表示。每做完一次二分割槽,我們就可以得到 1 位編碼值。

示例:經度值116.37,緯度值39.86的編碼過程

當一組經緯度值都編完碼後,我們再把它們的各自編碼值組合在一起,組合的規則是:最終編碼值的偶數位上依次是經度的編碼值,奇數位上依次是緯度的編碼值,其中,偶數位從 0 開始,奇數位從 1 開始。

使用 GeoHash 編碼後,我們相當於把整個地理空間劃分成了一個個方格,每個方格對應了 GeoHash 中的一個分割槽。所以使用 Sorted Set 範圍查詢得到的相近編碼值,在實際的地理空間上,也是相鄰的方格,這就可以實現 LBS 應用“搜尋附近的人或物”的功能了。

GEO其實是把經緯度編碼合併作為sorted set的key,但有時編碼相近並不一定是相鄰方格,一般的做法是同時查詢周圍的4或8個方格

操作方法

  • GEOADD 命令:用於把一組經緯度資訊和相對應的一個 ID 記錄到 GEO 型別集合中
  • GEORADIUS 命令:會根據輸入的經緯度位置,查詢以這個經緯度為中心的一定範圍內的其他元素。當然,我們可以自己定義這個範圍。
GEOADD cars:locations 116.034579 39.030452 33
GEORADIUS cars:locations 116.054579 39.030452 5 km ASC COUNT 10

自定義資料型別

Redis 鍵值對中的每一個值都是用 RedisObject 儲存的。

基本結構

RedisObject 的內部組成包括了 type、encoding、lru 和 refcount 4 個後設資料,以及 1 個*ptr指標。

  • type:表示值的型別,涵蓋了我們前面學習的五大基本型別;
  • encoding:是值的編碼方式,用來表示 Redis 中實現各個基本型別的底層資料結構,例如 SDS、壓縮列表、雜湊表、跳錶等;
  • lru:記錄了這個物件最後一次被訪問的時間,用於淘汰過期的鍵值對;
  • refcount:記錄了物件的引用計數;
  • *ptr:是指向資料的指標。

我們在定義了新的資料型別後,也只要在 RedisObject 中設定好新型別的 type 和 encoding,再用*ptr指向新型別的實現,就行了。

Redis其他資料型別和應用

List佇列:
rpush入棧 + lpop出棧。
缺點:不支援ack,不支援多消費者。

PubSub:
支援多消費者。
缺點:PubSub只能發給線上消費者,消費者下線會丟失資料。

Stream資料結構:
可以持久化、支援ack機制、支援多個消費者、支援回溯消費。

布隆過濾器:
解決業務層記憶體穿透。

14 時間序列資料

與發生時間相關的一組資料,就是時間序列資料。
這些資料的特點是沒有嚴格的關係模型,記錄的資訊可以表示成鍵和值的關係。

讀寫特點

寫入特點:寫入要快,資料型別在進行資料插入時,複雜度要低,儘量不要阻塞。

  1. 時間序列資料通常是持續高併發寫入的
  2. 一個時間序列資料被記錄後通常就不會變了

讀取特點:查詢模式多,單條記錄查詢,範圍查詢,聚合計算等。
解決方案:基於 Hash 和 Sorted Set 實現,以及基於 RedisTimeSeries 模組實現。

Hash 和 Sorted Set組合

儲存時間序列資料,同時儲存Hash 和 Sorted Set兩種型別。

Hash 型別

優點:可以實現對單鍵的快速查詢,滿足了時間序列資料的單鍵查詢需求。
缺點:無法範圍查詢。

HGET device:temperature 202008030905
"25.1"

HMGET device:temperature 202008030905 202008030907 202008030908
1) "25.1"
2) "25.9"
3) "24.9"

Sorted Set

把時間戳作為 Sorted Set 集合的元素分數,把時間點上記錄的資料作為元素本身。

ZRANGEBYSCORE device:temperature 202008030907 202008030910
1) "25.9"
2) "24.9"
3) "25.3"
4) "25.2"

保證原子性

當多個命令及其引數本身無誤時,MULTI 和 EXEC 命令可以保證執行這些命令時的原子性。

127.0.0.1:6379> MULTI
OK

127.0.0.1:6379> HSET device:temperature 202008030911 26.8
QUEUED

127.0.0.1:6379> ZADD device:temperature 202008030911 26.8
QUEUED

127.0.0.1:6379> EXEC
1) (integer) 1
2) (integer) 1

聚合計算

RedisTimeSeries 支援直接在 Redis 例項上進行聚合計算。

RedisTimeSeries 是 Redis 的一個擴充套件模組。它專門面向時間序列資料提供了資料型別和訪問介面,並且支援在 Redis 例項上直接對資料進行按時間範圍的聚合計算。

問題:如果你是Redis的開發維護者,你會把聚合計算也設計為Sorted Set的內在功能嗎?
解答:
不會。因為聚合計算是CPU密集型任務,Redis在處理請求時是單執行緒的,也就是它在做聚合計算時無法利用到多核CPU來提升計算速度,如果計算量太大,這也會導致Redis的響應延遲變長,影響Redis的效能。

Redis的定位就是高效能的記憶體資料庫,要求訪問速度極快。所以對於時序資料的儲存和聚合計算,我覺得更好的方式是交給時序資料庫去做,時序資料庫會針對這些儲存和計算的場景做針對性最佳化。

15 訊息佇列

訊息佇列在存取訊息時,必須要滿足三個需求,分別是訊息保序、處理重複的訊息和保證訊息可靠性。

Redis 的 List 和 Streams 兩種資料型別,就可以滿足訊息佇列的這三個需求。

List解決方案

訊息保序

生產者可以使用 LPUSH 命令把要傳送的訊息依次寫入 List,而消費者則可以使用 RPOP 命令,從 List 的另一端按照訊息的寫入順序,依次讀取訊息並進行處理。

效能風險:消費者需要不停執行RPOP,造成效能損失。
解決方案:阻塞式讀取 BRPOP,客戶端在沒有讀到佇列資料時,自動阻塞,直到有新的資料寫入佇列,再開始讀取新資料。

重複消費

要求:消費者程式本身能對重複訊息進行判斷。
方案:訊息佇列給每一個訊息提供全域性唯一的 ID 號;消費者程式要把已經處理過的訊息的 ID 號記錄下來。

冪等性:對於同一條訊息,消費者收到一次的處理結果和收到多次的處理結果是一致的。

可靠性

List 型別提供了 BRPOPLPUSH 命令,這個命令的作用是讓消費者程式從一個 List 中讀取訊息,同時,Redis 會把這個訊息再插入到另一個 List(可以叫作備份 List)留存。

這樣一來,如果消費者程式讀了訊息但沒能正常處理,等它重啟後,就可以從備份 List 中重新讀取訊息並進行處理了。

處理過程:生產者先用 LPUSH 把訊息插入到訊息佇列 mq 中。消費者程式使用 BRPOPLPUSH 命令讀取訊息,同時訊息還會被 Redis 插入到 mqback 佇列中。如果消費者程式處理訊息時當機了,等它重啟後,可以從 mqback 中再次讀取訊息,繼續處理。

問題:生產者訊息傳送很快,而消費者處理訊息的速度比較慢,這就導致 List 中的訊息越積越多,給 Redis 的記憶體帶來很大壓力。
解決:使用streams方案,啟動多個消費者程式組成一個消費組,一起分擔處理 List 中的訊息。

Streams解決方案

Streams 是 Redis 專門為訊息佇列設計的資料型別,它提供了豐富的訊息佇列操作命令。

  • XADD:插入訊息,保證有序,可以自動生成全域性唯一 ID;
  • XREAD:用於讀取訊息,可以按 ID 讀取資料;
  • XREADGROUP:按消費組形式讀取訊息;
  • XPENDING:用來查詢每個消費組內所有消費者已讀取但尚未確認的訊息;
  • XACK:用於向訊息佇列確認訊息處理已完成。

XADD

XADD 命令可以往訊息佇列中插入新訊息,訊息的格式是鍵 - 值對形式。對於插入的每一條訊息,Streams 可以自動為其生成一個全域性唯一的 ID。

XADD mqstream * repo 5
"1599203861727-0"

* 表示插入資料自動生成全域性唯一ID,也可以自行設定。

XREAD

XREAD 在讀取訊息時,可以指定一個訊息 ID,並從這個訊息 ID 的下一條訊息開始進行讀取。

XREAD BLOCK 100 STREAMS mqstream 1599203861727-0

呼叫 XRAED 時設定 block 配置項,實現類似於 BRPOP 的阻塞讀取操作。

XREAD block 10000 streams mqstream $
(nil)
(10.00s)

“$”符號表示讀取最新的訊息,XREAD沒有新訊息時阻塞 10000 毫秒(即 10 秒),然後返回nil。

XGROUP建立消費組

Streams 本身可以使用 XGROUP 建立消費組,建立消費組之後,Streams 可以使用 XREADGROUP 命令讓消費組內的消費者讀取訊息。

XGROUP create mqstream group1 0

XREADGROUP group group1 consumer1 streams mqstream >

讓 group1 消費組裡的消費者 consumer1 從 mqstream 中讀取所有訊息,其中,命令最後的引數“>”,表示從第一條尚未被消費的訊息開始讀取。

注意:訊息佇列中的訊息一旦被消費組裡的一個消費者讀取了,就不能再被該消費組內的其他消費者讀取了。

XPENDING

為了保證消費者在發生故障或當機再次重啟後,仍然可以讀取未處理完的訊息,Streams 會自動使用內部佇列(也稱為 PENDING List)留存消費組裡每個消費者讀取的訊息,直到消費者使用 XACK 命令通知 Streams“訊息已經處理完成”。

如果消費者沒有成功處理訊息,它就不會給 Streams 傳送 XACK 命令,訊息仍然會留存。此時,消費者可以在重啟後,用 XPENDING 命令檢視已讀取、但尚未確認處理完成的訊息。

檢視group2中消費者組已讀取、但未確認的訊息

XPENDING mqstream group2

查詢指定消費者

XPENDING mqstream group2 - + 10 consumer2

XACK

處理訊息後,消費者可以使用 XACK 命令通知 Streams,然後這條訊息就會被刪除。

相關文章