求不更學不動之Redis5.0新特性Stream嚐鮮

老錢發表於2018-06-01

原文網址 : https://juejin.im/post/5b10ad586fb9a01e4072a520

Redis5.0最近被作者突然放出來了，增加了很多新的特色功能。而Redis5.0最大的新特性就是多出了一個資料結構Stream，它是一個新的強大的支援多播的可持久化的訊息佇列，作者坦言Redis Stream狠狠地借鑑了Kafka的設計。

Redis Stream的結構如上圖所示，它有一個訊息連結串列，將所有加入的訊息都串起來，每個訊息都有一個唯一的ID和對應的內容。訊息是持久化的，Redis重啟後，內容還在。

每個Stream都有唯一的名稱，它就是Redis的key，在我們首次使用xadd指令追加訊息時自動建立。

每個Stream都可以掛多個消費組，每個消費組會有個遊標last_delivered_id在Stream陣列之上往前移動，表示當前消費組已經消費到哪條訊息了。每個消費組都有一個Stream內唯一的名稱，消費組不會自動建立，它需要單獨的指令xgroup create進行建立，需要指定從Stream的某個訊息ID開始消費，這個ID用來初始化last_delivered_id變數。

每個消費組(Consumer Group)的狀態都是獨立的，相互不受影響。也就是說同一份Stream內部的訊息會被每個消費組都消費到。

同一個消費組(Consumer Group)可以掛接多個消費者(Consumer)，這些消費者之間是競爭關係，任意一個消費者讀取了訊息都會使遊標last_delivered_id往前移動。每個消費者者有一個組內唯一名稱。

消費者(Consumer)內部會有個狀態變數pending_ids，它記錄了當前已經被客戶端讀取的訊息，但是還沒有ack。如果客戶端沒有ack，這個變數裡面的訊息ID會越來越多，一旦某個訊息被ack，它就開始減少。這個pending_ids變數在Redis官方被稱之為PEL，也就是Pending Entries List，這是一個很核心的資料結構，它用來確保客戶端至少消費了訊息一次，而不會在網路傳輸的中途丟失了沒處理。

訊息ID

訊息ID的形式是timestampInMillis-sequence，例如1527846880572-5，它表示當前的訊息在毫米時間戳1527846880572時產生，並且是該毫秒內產生的第5條訊息。訊息ID可以由伺服器自動生成，也可以由客戶端自己指定，但是形式必須是整數-整數，而且必須是後面加入的訊息的ID要大於前面的訊息ID。

訊息內容

訊息內容就是鍵值對，形如hash結構的鍵值對，這沒什麼特別之處。

增刪改查

xadd 追加訊息
xdel 刪除訊息，這裡的刪除僅僅是設定了標誌位，不影響訊息總長度
xrange 獲取訊息列表，會自動過濾已經刪除的訊息
xlen 訊息長度
del 刪除Stream

# *號表示伺服器自動生成ID，後面順序跟著一堆key/value
#  名字叫laoqian，年齡30歲
127.0.0.1:6379> xadd codehole * name laoqian age 30  
1527849609889-0  # 生成的訊息ID
127.0.0.1:6379> xadd codehole * name xiaoyu age 29
1527849629172-0
127.0.0.1:6379> xadd codehole * name xiaoqian age 1
1527849637634-0
127.0.0.1:6379> xlen codehole
(integer) 3
# -表示最小值, +表示最大值
127.0.0.1:6379> xrange codehole - +
127.0.0.1:6379> xrange codehole - +
1) 1) 1527849609889-0
   2) 1) "name"
      2) "laoqian"
      3) "age"
      4) "30"
2) 1) 1527849629172-0
   2) 1) "name"
      2) "xiaoyu"
      3) "age"
      4) "29"
3) 1) 1527849637634-0
   2) 1) "name"
      2) "xiaoqian"
      3) "age"
      4) "1"
# 指定最小訊息ID的列表
127.0.0.1:6379> xrange codehole 1527849629172-0 +  
1) 1) 1527849629172-0
   2) 1) "name"
      2) "xiaoyu"
      3) "age"
      4) "29"
2) 1) 1527849637634-0
   2) 1) "name"
      2) "xiaoqian"
      3) "age"
      4) "1"
# 指定最大訊息ID的列表
127.0.0.1:6379> xrange codehole - 1527849629172-0
1) 1) 1527849609889-0
   2) 1) "name"
      2) "laoqian"
      3) "age"
      4) "30"
2) 1) 1527849629172-0
   2) 1) "name"
      2) "xiaoyu"
      3) "age"
      4) "29"
127.0.0.1:6379> xdel codehole 1527849609889-0
(integer) 1
# 長度不受影響
127.0.0.1:6379> xlen codehole
(integer) 3
# 被刪除的訊息沒了
127.0.0.1:6379> xrange codehole - +
1) 1) 1527849629172-0
   2) 1) "name"
      2) "xiaoyu"
      3) "age"
      4) "29"
2) 1) 1527849637634-0
   2) 1) "name"
      2) "xiaoqian"
      3) "age"
      4) "1"
# 刪除整個Stream
127.0.0.1:6379> del codehole
(integer) 1
複製程式碼

獨立消費

我們可以在不定義消費組的情況下進行Stream訊息的獨立消費，當Stream沒有新訊息時，甚至可以阻塞等待。Redis設計了一個單獨的消費指令xread，可以將Stream當成普通的訊息佇列(list)來使用。使用xread時，我們可以完全忽略消費組(Consumer Group)的存在，就好比Stream就是一個普通的列表(list)。

# 從Stream頭部讀取兩條訊息
127.0.0.1:6379> xread count 2 streams codehole 0-0
1) 1) "codehole"
   2) 1) 1) 1527851486781-0
         2) 1) "name"
            2) "laoqian"
            3) "age"
            4) "30"
      2) 1) 1527851493405-0
         2) 1) "name"
            2) "yurui"
            3) "age"
            4) "29"
# 從Stream尾部讀取一條訊息，毫無疑問，這裡不會返回任何訊息
127.0.0.1:6379> xread count 1 streams codehole $
(nil)
# 從尾部阻塞等待新訊息到來，下面的指令會堵住，直到新訊息到來
127.0.0.1:6379> xread block 0 count 1 streams codehole $
# 我們從新開啟一個視窗，在這個視窗往Stream裡塞訊息
127.0.0.1:6379> xadd codehole * name youming age 60
1527852774092-0
# 再切換到前面的視窗，我們可以看到阻塞解除了，返回了新的訊息內容
# 而且還顯示了一個等待時間，這裡我們等待了93s
127.0.0.1:6379> xread block 0 count 1 streams codehole $
1) 1) "codehole"
   2) 1) 1) 1527852774092-0
         2) 1) "name"
            2) "youming"
            3) "age"
            4) "60"
(93.11s)
複製程式碼

客戶端如果想要使用xread進行順序消費，一定要記住當前消費到哪裡了，也就是返回的訊息ID。下次繼續呼叫xread時，將上次返回的最後一個訊息ID作為引數傳遞進去，就可以繼續消費後續的訊息。

block 0表示永遠阻塞，直到訊息到來，block 1000表示阻塞1s，如果1s內沒有任何訊息到來，就返回nil

127.0.0.1:6379> xread block 1000 count 1 streams codehole $
(nil)
(1.07s)
複製程式碼

建立消費組

Stream通過xgroup create指令建立消費組(Consumer Group)，需要傳遞起始訊息ID引數用來初始化last_delivered_id變數。

#  表示從頭開始消費
127.0.0.1:6379> xgroup create codehole cg1 0-0
OK
# $表示從尾部開始消費，只接受新訊息，當前Stream訊息會全部忽略
127.0.0.1:6379> xgroup create codehole cg2 $
OK
# 獲取Stream資訊
127.0.0.1:6379> xinfo codehole
 1) length
 2) (integer) 3  # 共3個訊息
 3) radix-tree-keys
 4) (integer) 1
 5) radix-tree-nodes
 6) (integer) 2
 7) groups
 8) (integer) 2  # 兩個消費組
 9) first-entry  # 第一個訊息
10) 1) 1527851486781-0
    2) 1) "name"
       2) "laoqian"
       3) "age"
       4) "30"
11) last-entry  # 最後一個訊息
12) 1) 1527851498956-0
    2) 1) "name"
       2) "xiaoqian"
       3) "age"
       4) "1"
# 獲取Stream的消費組資訊
127.0.0.1:6379> xinfo groups codehole
1) 1) name
   2) "cg1"
   3) consumers
   4) (integer) 0  # 該消費組還沒有消費者
   5) pending
   6) (integer) 0  # 該消費組沒有正在處理的訊息
2) 1) name
   2) "cg2"
   3) consumers  # 該消費組還沒有消費者
   4) (integer) 0
   5) pending
   6) (integer) 0  # 該消費組沒有正在處理的訊息
複製程式碼

消費

Stream提供了xreadgroup指令可以進行消費組的組內消費，需要提供消費組名稱、消費者名稱和起始訊息ID。它同xread一樣，也可以阻塞等待新訊息。讀到新訊息後，對應的訊息ID就會進入消費者的PEL(正在處理的訊息)結構裡，客戶端處理完畢後使用xack指令通知伺服器，本條訊息已經處理完畢，該訊息ID就會從PEL中移除。

# >號表示從當前消費組的last_delivered_id後面開始讀
# 每當消費者讀取一條訊息，last_delivered_id變數就會前進
127.0.0.1:6379> xreadgroup GROUP cg1 c1 count 1 streams codehole >
1) 1) "codehole"
   2) 1) 1) 1527851486781-0
         2) 1) "name"
            2) "laoqian"
            3) "age"
            4) "30"
127.0.0.1:6379> xreadgroup GROUP cg1 c1 count 1 streams codehole >
1) 1) "codehole"
   2) 1) 1) 1527851493405-0
         2) 1) "name"
            2) "yurui"
            3) "age"
            4) "29"
127.0.0.1:6379> xreadgroup GROUP cg1 c1 count 2 streams codehole >
1) 1) "codehole"
   2) 1) 1) 1527851498956-0
         2) 1) "name"
            2) "xiaoqian"
            3) "age"
            4) "1"
      2) 1) 1527852774092-0
         2) 1) "name"
            2) "youming"
            3) "age"
            4) "60"
# 再繼續讀取，就沒有新訊息了
127.0.0.1:6379> xreadgroup GROUP cg1 c1 count 1 streams codehole >
(nil)
# 那就阻塞等待吧
127.0.0.1:6379> xreadgroup GROUP cg1 c1 block 0 count 1 streams codehole >
# 開啟另一個視窗，往裡塞訊息
127.0.0.1:6379> xadd codehole * name lanying age 61
1527854062442-0
# 回到前一個視窗，發現阻塞解除，收到新訊息了
127.0.0.1:6379> xreadgroup GROUP cg1 c1 block 0 count 1 streams codehole >
1) 1) "codehole"
   2) 1) 1) 1527854062442-0
         2) 1) "name"
            2) "lanying"
            3) "age"
            4) "61"
(36.54s)
# 觀察消費組資訊
127.0.0.1:6379> xinfo groups codehole
1) 1) name
   2) "cg1"
   3) consumers
   4) (integer) 1  # 一個消費者
   5) pending
   6) (integer) 5  # 共5條正在處理的資訊還有沒有ack
2) 1) name
   2) "cg2"
   3) consumers
   4) (integer) 0  # 消費組cg2沒有任何變化，因為前面我們一直在操縱cg1
   5) pending
   6) (integer) 0
# 如果同一個消費組有多個消費者，我們可以通過xinfo consumers指令觀察每個消費者的狀態
127.0.0.1:6379> xinfo consumers codehole cg1  # 目前還有1個消費者
1) 1) name
   2) "c1"
   3) pending
   4) (integer) 5  # 共5條待處理訊息
   5) idle
   6) (integer) 418715  # 空閒了多長時間ms沒有讀取訊息了
# 接下來我們ack一條訊息
127.0.0.1:6379> xack codehole cg1 1527851486781-0
(integer) 1
127.0.0.1:6379> xinfo consumers codehole cg1
1) 1) name
   2) "c1"
   3) pending
   4) (integer) 4  # 變成了5條
   5) idle
   6) (integer) 668504
# 下面ack所有訊息
127.0.0.1:6379> xack codehole cg1 1527851493405-0 1527851498956-0 1527852774092-0 1527854062442-0
(integer) 4
127.0.0.1:6379> xinfo consumers codehole cg1
1) 1) name
   2) "c1"
   3) pending
   4) (integer) 0  # pel空了
   5) idle
   6) (integer) 745505
複製程式碼

Stream訊息太多怎麼辦

讀者很容易想到，要是訊息積累太多，Stream的連結串列豈不是很長，內容會不會爆掉就是個問題了。xdel指令又不會刪除訊息，它只是給訊息做了個標誌位。

Redis自然考慮到了這一點，所以它提供了一個定長Stream功能。在xadd的指令提供一個定長長度maxlen，就可以將老的訊息幹掉，確保最多不超過指定長度。

127.0.0.1:6379> xlen codehole
(integer) 5
127.0.0.1:6379> xadd codehole maxlen 3 * name xiaorui age 1
1527855160273-0
127.0.0.1:6379> xlen codehole
(integer) 3
複製程式碼

我們看到Stream的長度被砍掉了。

訊息如果忘記ACK會怎樣

Stream在每個消費者結構中儲存了正在處理中的訊息ID列表PEL，如果消費者收到了訊息處理完了但是沒有回覆ack，就會導致PEL列表不斷增長，如果有很多消費組的話，那麼這個PEL佔用的記憶體就會放大。

PEL如何避免訊息丟失

在客戶端消費者讀取Stream訊息時，Redis伺服器將訊息回覆給客戶端的過程中，客戶端突然斷開了連線，訊息就丟失了。但是PEL裡已經儲存了發出去的訊息ID。待客戶端重新連上之後，可以再次收到PEL中的訊息ID列表。不過此時xreadgroup的起始訊息ID不能為引數>，而必須是任意有效的訊息ID，一般將引數設為0-0，表示讀取所有的PEL訊息以及自last_delivered_id之後的新訊息。

結論

Stream的消費模型借鑑了kafka的消費分組的概念，它彌補了Redis Pub/Sub不能持久化訊息的缺陷。但是它又不同於kafka，kafka的訊息可以分partition，而Stream不行。如果非要分parition的話，得在客戶端做，提供不同的Stream名稱，對訊息進行hash取模來選擇往哪個Stream裡塞。如果讀者稍微研究過Redis作者的另一個開源專案Disque的話，這極可能是作者意識到Disque專案的活躍程度不夠，所以將Disque的內容移植到了Redis裡面。這只是本人的猜測，未必是作者的初衷。如果讀者有什麼不同的想法，可以在評論區一起參與討論。

閱讀更多高階文章，關注公眾號「碼洞」

求不更學不動之Node.js多執行緒
2021-09-09
Node.js執行緒
TiDB 4.0 新特性嚐鮮指南
2021-09-09
TiDB
Webpack5.0 新特性嚐鮮實戰 ??
2019-03-12
Web
Redis5.0 新特性
2018-09-13
Redis
JDK8新特性之stream()
2019-10-16
JDK
JDK 1.8 新特性學習（Stream）
2019-01-19
JDK
JDK8新特性之Stream流
2018-05-03
JDK
Julia 嚐鮮
2022-01-15
Java8新特性探索之Stream介面
2020-10-28
Java
我還在生產玩 JDK7，JDK 15 卻要來了!|新特性嚐鮮
2020-08-05
JDK
React Loops 嚐鮮
2019-04-04
ReactOOP
React Suspense 嚐鮮
2019-03-06
React
JDK新特性--Stream流
2024-10-29
JDK
Java 8 新特性 Stream
2024-11-03
Java
JAVA 1.8 新特性 Stream
2022-01-24
Java
Redis5.0版本的12項新特性
2018-06-20
Redis
嚐鮮Oracle Database 12c的十二大新特性VK
2022-03-21
OracleDatabase
JEP 嚐鮮系列 3 - 使用虛執行緒進行同步網路 IO 的不阻塞原理
2021-05-25
執行緒
.Net8 Blazor 嚐鮮
2023-11-15
Blazor
Vue.js 2.6嚐鮮
2019-02-05
Vue.js
Go 1.17 泛型嚐鮮
2021-08-17
Go泛型
Windows 10 週年版嚐鮮
2021-09-09
Windows
利用Conda嚐鮮Python 3.10
2021-10-09
Python
鴻蒙系統嚐鮮
2021-01-14
鴻蒙
java8新特性stream流
2018-08-26
Java
深入理解 Redis 新特性：Stream
2023-04-17
Redis
Java8新特性--Stream API
2021-03-13
JavaAPI
Java協程程式設計之Loom專案嚐鮮
2021-08-20
Java程式設計OOM
全部python工具，新鮮出爐，拿走不謝，別客氣
2019-01-04
Python
Redis5 的新特性 Redis Stream
2020-11-21
Redis
JDK8新特性（4）—— stream 流
2020-12-02
JDK
Flutter嚐鮮：跨平臺移動應用開發
2018-06-06
Flutter
Spring Boot 2.0(二)：Spring Boot 2.0嚐鮮-動態 Banner
2018-03-03
Spring Boot
寫註釋就能自動出程式碼？copilot 嚐鮮
2021-10-09
JDK 8 新特性之函數語言程式設計 → Stream API
2020-08-31
JDK函數程式設計API
HTML5中dialog元素嚐鮮
2019-02-16
HTML
Spring Cloud Gateway 閘道器嚐鮮
2018-11-14
SpringCloudGateway
Flutter新版本 Web App 嚐鮮
2019-09-17
FlutterWebAPP