RabbitMQ和Kafka到底怎麼選（二）？

haolujun發表於2018-09-14

原文網址 : https://www.cnblogs.com/haolujun/p/9641840.html

前言

前一篇文章《RabbitMQ和Kafka到底怎麼選？》，我們在吞吐量方面比較了Kafka和RabbitMQ，知道了Kafka的吞吐量要高於RabbitMQ。本文從可靠性方面繼續探討兩個佇列的差異。

RabbitMQ可靠性

我們通過前文知道，RabbitMQ的佇列分為master queue和mirror queue，mirror queue 在master queue當機之後，會被提升為master queue，如下圖所示。
RabbitMQ和Kafka到底怎麼選（二）？
佇列A的consumer在消費的時候，機器當機，此時客戶端和服務端分別做如下動作：

服務端：把mirror queue提升為master queue
客戶端：連線到新的master queue 所在的節點進行消費或者生產

當master queue 所在節點當機後，其正在被消費的訊息的相關資訊全部丟失，即服務端不知道消費者對那一瞬間消費的訊息是否進行了ACK，所以在mirror queue被提升為master queue時，會把當機前正在進行消費的的訊息全部重新傳送一遍，即客戶端重連後，訊息可能被重複消費，這個時候就必須依靠應用層邏輯來判斷來避免重複消費。

在持久化方面，RabbitMQ的master queue每次收到新訊息後，都會立刻寫入磁碟，並把訊息同步給mirror queue。假設在master queue 收到訊息後，訊息未同步到mirror queue 之前master queue 當機，則此時mirror queue中就沒有剛剛master queue收到的那條訊息，當這個mirror queue被提升為master queue時，消費者連線到新的master queue上進行消費時就丟了一條訊息。所以，RabbitMQ也會丟訊息，只不過這個丟訊息的概率非常低。

Kafka可靠性

我們知道Kafka中的每個佇列叫做Topic，一個Topic有多個主分片和副分片，當主分片所在機器當機後，服務端會把一個副分片提升為主分片，如下圖所示。
RabbitMQ和Kafka到底怎麼選（二）？

服務端和客戶端會有如下動作：

服務端：把副分片提升為主分片
客戶端：連線到新的主分片

Kafka同樣有主從同步，所以也必定存在與RabbitMQ同樣丟訊息的問題。但是Kafka的每個客戶端儲存了讀取訊息的偏移資訊，故當一個主分片當機後，Kafka客戶端可以從副分片相應位移後繼續消費，不會有重複消費的情況。

持久化方面，Kafka預設把訊息直接寫檔案，但是由於作業系統的cache原因，訊息可能不會立馬寫到磁碟上，這個時候就需要重新整理檔案到磁碟。由於重新整理檔案到磁碟是一個比較耗時的操作，故Kafka提供了兩種不同的重新整理配置：

#每接收多少條訊息刷一下磁碟
log.flush.interval.messages=10000
#每隔多少ms刷一下磁碟
log.flush.interval.ms=1000

我們完全可以把log.flush.interval.messages設定為1，這樣Kafka就能在持久化方面達到和RabbitMQ同樣的安全級別。

RabbitMQ和Kafka到底怎麼選（二）？

但是Kafka叢集依賴ZK，如上圖所示，所以對於Kafka穩定性的評估必須考慮ZK叢集的穩定性，而一般我們認為任何分散式叢集的穩定性都小於1，故兩個叢集的串聯穩定性會下降一些，維護更復雜一些，這點沒有RabbitMQ有優勢。

總結

其實好多開源元件隨著時間推移，往往都進行了各種改進。就比如Kafka雖然是為了日誌而生，給人第一印象是容易丟訊息，但是經過這麼多年的改進，其可靠性可能並不遜色RabbitMQ了，只需要你根據不同的業務場景配置不同的配置引數，即可達到適合自己的安全級別。

從吞吐量上看，在不要求訊息順序情況下，Kafka完勝；在要求訊息先後順序的場景，效能應該稍遜RabbitMQ（此時Kafka的分片數只能為1）。
從穩定性來看，RabbitMQ勝出，但是Kafka也並不遜色多少。

好了，以上就是我的個人分析，多有不足，希望能和小夥伴進行探討。

RabbitMQ和Kafka到底怎麼選？
2018-09-12
MQKafka
RabbitMQ與Kafka選型對比
2020-09-25
MQKafka
Kafka 與 RabbitMQ 如何選擇使用哪個？
2021-08-28
KafkaMQ
微服務選擇哪個訊息代理：RabbitMQ、Kafka和Redis？ - Payoda
2021-11-23
微服務MQKafkaRedis
MVC、MVP、MVVM，我到底該怎麼選？
2018-07-03
MVCMVPMVVM
Kafka和RabbitMQ有哪些區別，各自適合什麼場景？
2022-01-06
KafkaMQ
RabbitMQ和Kafka的高可用叢集原理
2020-09-11
MQKafka
kafka學習（二）-------- 什麼是Kafka
2019-07-22
Kafka
事件流平臺Kafka、Pulsar和RabbitMQ比較 - Picnic
2021-11-24
事件KafkaMQ
為什麼我們從RabbitMQ切換到apache kafka？
2018-08-24
MQApacheKafka
web自動化測試工具那麼多，教你到底該怎麼選
2020-12-11
Web
外貿軟體哪個好？到底怎麼選才靠譜？
2023-03-25
RabbitMQ（二）：RabbitMQ高階特性
2019-07-21
MQ
電源功率到底選多大？老司機告訴你電源功率怎麼選？
2018-08-04
IM系統的MQ訊息中介軟體選型：Kafka還是RabbitMQ？
2018-06-09
MQKafka
Redis、Kafka或RabbitMQ：選擇哪個作為微服務訊息代理？ - otonomo
2020-10-13
RedisKafkaMQ微服務
RabbitMQ推出類似Kafka的流Stream
2021-07-14
MQKafka
Kafka科普系列 | 原來Kafka中的選舉有這麼多？
2019-05-17
Kafka
磁碟格式之exFat和NTFS怎麼選？
2019-01-22
雲伺服器和VPS，怎麼選？
2020-12-07
伺服器
Kafka選型
2020-12-14
Kafka
一個就只是JMS的開源專案，沒有Kafka和RabbitMQ！
2021-06-06
KafkaMQ
訊息中介軟體選型分析：從Kafka與RabbitMQ的對比看全域性
2018-04-12
KafkaMQ
RabbitMQ，RocketMQ，Kafka 訊息模型對比分析
2021-12-18
MQKafka模型
RabbitMQ、RocketMQ、Kafka延遲佇列實現
2022-12-22
MQKafka佇列
最好用的 10 款 MySQL 管理工具橫向測評 - 免費和付費到底怎麼選?
2021-11-03
MySql
大公司和創業公司怎麼選？
2018-04-16
創業
Kafka到底有多高可靠？（RNG NB）
2022-05-30
Kafka
RabbitMQ 入門(二)基本結構和訊息模型
2024-10-13
MQ模型
Shit!我的host到底怎麼了?
2018-08-22
iOS_Model層到底怎麼用？
2018-08-18
iOS
HashMap到底是怎麼put的？
2018-08-08
HashMap
iframe中的二級選單被遮蓋怎麼辦？
2021-10-22
訊息中介軟體(RabbitMq、Kafka)分析比較
2018-09-17
MQKafka
Kafka 學習筆記（二）：初探 Kafka
2019-03-04
Kafka筆記
Kafka學習筆記（二）：初探Kafka
2018-03-26
Kafka筆記
你是怎麼選擇resetting和normalizing的？為什麼？
2024-11-27
ORM
React 和 Vue 到底誰更牛？聽聽尤雨溪怎麼說
2018-12-19
ReactVue

RabbitMQ和Kafka到底怎麼選（二）？

前言

RabbitMQ可靠性

Kafka可靠性

總結

相關文章