實際業務處理 Kafka 訊息丟失、重複消費和順序消費的問題

小馮Coding發表於2022-04-05

原文網址 : https://www.cnblogs.com/Fzeng/p/16102422.html

Kafka

關於 Kafka 訊息丟失、重複消費和順序消費的問題

訊息丟失，訊息重複消費，訊息順序消費等問題是我們使用 MQ 時不得不考慮的一個問題，下面我結合實際的業務來和你分享一下解決方案。

訊息丟失問題

比如我們使用 Kakfa 時，以下場景都會發生訊息丟失：

producer -> broker （生產者生產訊息）
broker -> broker (叢集環境，broker 同步給其他 broker)
broker -> consumer （消費者消費訊息）

解決方案也很簡單，設定 acks（訊息確認機制）retries（重試機制）factor（設定 partition 數量）...

一般來說，最常見的訊息丟失場景就是：consumer 消費訊息。

要保證 consumer 消費訊息時不丟失訊息，必須使用手動提交 ack

我們業務是這樣實現的：

從 Kafka 拉取訊息（一次批量拉取 100條）
為每條訊息分配一個 msgId（遞增）
將 msgId 存入記憶體佇列（sortSet）
使用 Map 儲存 msgId 與 msg （包含 offset）的對映關係
當業務處理完訊息後，獲取當前訊息的 msgId，然後從 sortSet 中刪除該 msgId（表示該訊息已經處理過了）
ack 時，如果當前 msgId <= sortSet（msgId 在 sortSet 中是從小到大排列），就提交當前 offset
就算 consumer 在處理訊息時掛了，下次重啟時就會從 sortSet 隊首的訊息開始拉取，實現至少處理一次語義。
步驟 7 存在一個問題：當訊息處理完後，還沒從 sortSet 中刪除該 msgId，系統就掛了，當系統重啟時，又會重新處理一次剛剛已處理過的訊息，這就引出訊息重複消費的問題了。

訊息重複消費

要解決訊息重複消費，也就是要實現冪等（冪等就是：多次請求，但結果保持不變，舉一個例子你就明白了：在 http 中，你傳送同一個 get 請求，無論傳送多少次，返回結果都是一樣的）

回到我們的業務場景上，我以處理訂單訊息為例：

冪等Key 由我們的訂單Id + 訂單狀態組成（一筆訂單的狀態只會處理一次）
在處理之前，我們首先會去 Redis 查詢是否存在這個 Key

如果存在，說明我們已經處理過了，直接丟掉；

如果不存在，說明沒處理過，繼續往下處理；
最終的邏輯是：將處理過的資料存到DB上，再把 冪等Key 存到 Redis 上

顯然一般場景下 Redis 是無法保證冪等的

所以Redis只是一個前置處理，最終的冪等性依賴 DB 的唯一Key（訂單Id+訂單狀態）

總的來說就是：通過 Redis 做前置處理，DB 唯一索引做最終保證實現冪等性

訊息順序消費

訊息的順序性很好理解，還是以訂單處理為例

訂單的狀態有：支付、確認收貨、完成等等，而訂單下還有計費、退款的訊息報

理論上來說：支付的訊息肯定要比退款的訊息先到。

但是程式處理的過程就不一定了，所以我們處理訊息順序消費的流程如下：

寬表：建立一張寬表，唯一索引是 訂單Id，將訂單的每個狀態拆分為一個列，當訊息來了，只更新對應的欄位就好，訊息只會存在短暫的狀態不一致問題，但是最終狀態是一致的
訊息補償機制
把相同的 userID/orderId 傳送到相同的 partition（因為一個 consumer 消費一個 partition）

mq要如何處理訊息丟失、重複消費？
2020-11-05
MQ
解決RabbitMQ訊息丟失與重複消費問題
2018-07-08
MQ
RabbitMQ多消費者順序性消費訊息實現
2021-11-03
MQ
Spring Cloud Stream如何處理訊息重複消費？
2018-11-26
SpringCloud
kafka 消費組功能驗證以及消費者資料重複資料丟失問題說明 3
2020-12-04
Kafka
探索RocketMQ的重複消費和亂序問題
2020-11-13
MQ
Kafka 如何保證訊息消費的全域性順序性
2023-11-27
Kafka
kafka消費者消費訊息的流程
2020-11-28
Kafka
RabbitMQ如何解決被重複消費和資料丟失的問題？
2018-11-05
MQ
RocketMq如何順序消費的訊息offest
2022-02-06
MQ
Kafka中消費者延遲處理訊息
2024-05-25
Kafka
Kafka 訊息丟失與消費精確一次性
2020-07-03
Kafka
位元組跳動面試官這樣問訊息佇列：分散式事務、重複消費、順序消費，我整理了一下
2020-02-16
面試佇列分散式
kafka多執行緒順序消費
2024-05-28
Kafka執行緒
kafka 如何保證不重複消費又不丟失資料？
2024-06-20
Kafka
“田由甲” - Kafka重複消費線上問題暴雷
2024-03-10
Kafka
如何保證訊息不被重複消費
2020-08-07
訊息中介軟體—RocketMQ訊息消費（三）（訊息消費重試）
2021-09-09
MQ
訊息中介軟體消費到的訊息處理失敗怎麼辦？
2019-05-21
訊息佇列-如何保證訊息的不被重複消費（如何保證訊息消費的冪等性）
2021-11-19
佇列
《RabbitMQ》如何保證訊息不被重複消費
2020-08-06
MQ
分散式訊息佇列：如何保證訊息不被重複消費?（訊息佇列消費的冪等性）
2019-03-26
分散式佇列
RabbitMQ，RocketMQ，Kafka 事務性，訊息丟失和訊息重複傳送的處理策略
2021-12-30
MQKafka
如何處理RabbitMQ 訊息堆積和訊息丟失問題
2021-07-17
MQ
spring-kafka多執行緒順序消費
2019-10-10
SpringKafka執行緒
阿里面試題剖析，如何保證訊息不被重複消費？
2019-03-19
阿里面試題
位元組跳動面試官這樣問訊息佇列：高可用、不重複消費、可靠傳輸、順序消費、訊息堆積，我整理了下
2021-02-24
面試佇列
RocketMQ系列（四）順序消費
2020-06-10
MQ
RocketMQ(7)---RocketMQ順序消費
2019-07-05
MQ
一次 RocketMQ 順序消費延遲的問題定位
2021-07-01
MQ
Kafka消費者自動提交配置會導致潛在的重複或資料丟失！
2018-12-24
Kafka
【Java面試】Kafka 怎麼避免重複消費
2022-06-24
Java面試Kafka
記一次RocketMQ消費非順序訊息引起的線上事故
2024-06-30
MQ
阿里雲 KAFKA 消費者接收不到訊息
2020-12-16
阿里Kafka
Kafka訊息分發、主題分割槽與消費組的概念
2018-03-14
Kafka
kafka消費
2024-03-21
Kafka
Kafka無法消費?!我的分散式訊息服務Kafka卻穩如泰山！
2018-08-21
Kafka分散式
訊息推送平臺的實時數倉？！flink消費kafka訊息入到hive
2023-05-10
KafkaHive

實際業務處理 Kafka 訊息丟失、重複消費和順序消費的問題

關於 Kafka 訊息丟失、重複消費和順序消費的問題

訊息丟失問題

訊息重複消費

訊息順序消費

相關文章