引言
所謂的消費語義,指的就是如下三種情況
- 如何保證訊息最多消費一次
- 如何保證訊息至少消費一次
- 如何保證訊息恰好消費一次
其實類似還有一個投遞語義
- 如何保證訊息最多投遞一次
- 如何保證訊息至少投遞一次
- 如何保證訊息恰好投遞一次
說句實在話,其實還是老問題,只是換了一種問法!
OK,開始我們的正文
正文
我們先做如下約定
Producer
代表生產者Consumer
代表消費者Message Queue
代表訊息佇列
投遞語義
我們先從投遞語義開始講起,因為要先把這個概念講明白了,才能講消費語義。恰巧,kafka
實現了這三種語義,我們以kafka
來說明。
如何保證訊息最多投遞一次?
簡單,就是我已經投出去了,收沒收到不管了,會存在訊息丟失。
我們在初始化Producer
時可以通過配置request.required.acks
不同的值,來實現不同的傳送模式。
這裡將request.required.acks
設為0,意思就是Producer
不等待Leader確認,只管發出即可;最可能丟失訊息。如果丟了訊息,就是投遞0次。如果沒丟,就是投遞1次。符合最多投遞一次的含義。
如何保證訊息至少投遞一次?
這裡將request.required.acks
設為-1。Producer
往kafka
的Leader(主)
節點傳送訊息後,會等follower(從)
節點同步完資料以後,再給Producer
返回ACK確認訊息。
但是這裡是有機率出現重複消費的問題的。
例如,kafka
儲存訊息後,傳送ACK前當機,Producer
認為訊息未傳送成功並重試,造成資料重複!
那麼,在這種情況下,就會出現大於1次的投遞情況,符合至少投遞一次的含義。
如何保證訊息恰好投遞一次?
kafka
在0.11.0.0版本之後支援恰好投遞一次的語義。
我們將enable.idempotence
設定為ture,此時就會預設把request.required.acks
設為-1,可以達到恰好投遞一次的語義。
如何做到的?
為了實現Producer
的冪等語義,Kafka引入了Producer ID(即PID)和Sequence Number。
kafka
為每個Producer
分配一個pid,作為該Producer
的唯一標識。
Producer
會為每一個<topic,partition>維護一個單調遞增的seq。
類似的,Message Queue
也會為每個<pid,topic,partition>記錄下最新的seq。
當req_seq == message_seq+1時,Message Queue
才會接受該訊息。因為:
- (1)訊息的seq比
Message Queue
的seq大一以上,說明中間有資料還沒寫入,即亂序了。 - (2)訊息的seq比
Message Queue
的seq小,那麼說明該訊息已被儲存。
消費語義
這裡我們還是做一個定義如下所示
consumer.poll()
表示消費者獲取訊息內容processMsg(message)
表示下游系統進行消費訊息consumer.commit()
表示消費者往訊息佇列提交確認資訊,訊息佇列接到確認訊息,刪除該訊息。
注意了,我是以processMsg
函式,即處理訊息的過程,定義為消費訊息。
如何保證訊息最多消費一次?
Producer
:滿足最多投遞一次的語義即可,即只管發訊息,不需要等待訊息佇列返回確認訊息。
Message Queue
:接到訊息後往記憶體中一放就行,不用持久化儲存。
Consumer
:拉取到訊息以後,直接給訊息佇列返回確認訊息即可。至於後續消費訊息成功與否,無所謂的。即按照以下順序執行
consumer.poll();
consumer.commit();
processMsg(message);
如何保證訊息至少消費一次?
Producer
:滿足至少投遞一次語義即可,即傳送訊息後,需要等待訊息佇列返回確認訊息。如果超時沒收到確認訊息,則重發。
Message Queue
:接到訊息後,進行持久化儲存,而後返回生產者確認訊息。
Consumer
:拉取到訊息後,進行消費,消費成功後,再返回確認訊息。即按照如下順序執行
consumer.poll();
processMsg(message);
consumer.commit();
由於這裡Producer
滿足的是至少投遞一次語義,因此訊息佇列中是有重複訊息的。所以我們的Consumer
會出現重複消費的情形!
如何保證訊息恰好消費一次?
在保證至少消費一次的基礎上,processMsg
滿足冪等性操作即可。
如何保證冪等性操作?
老問題了,比如有狀態的訊息啊。比如唯一表啊。大家搜一搜,一大堆答案,不想重複說了。
總結
本文講的是訊息佇列的消費語義和投遞語義的含義,希望大家有所收穫。