淺談訊息佇列及常見的訊息中介軟體

零壹技術棧發表於2018-07-08

前言

訊息佇列 已經逐漸成為企業應用系統 內部通訊 的核心手段。它具有 低耦合可靠投遞廣播流量控制最終一致性 等一系列功能。

當前使用較多的 訊息佇列RabbitMQRocketMQActiveMQKafkaZeroMQMetaMQ 等,而部分 資料庫RedisMySQL 以及 phxsql 也可實現訊息佇列的功能。

淺談訊息佇列及常見的訊息中介軟體

正文

1. 訊息佇列概述

訊息佇列 是指利用 高效可靠訊息傳遞機制 進行與平臺無關的 資料交流,並基於 資料通訊 來進行分散式系統的整合。

淺談訊息佇列及常見的訊息中介軟體

通過提供 訊息傳遞訊息排隊 模型,它可以在 分散式環境 下提供 應用解耦彈性伸縮冗餘儲存流量削峰非同步通訊資料同步 等等功能,其作為 分散式系統架構 中的一個重要元件,有著舉足輕重的地位。

2. 訊息佇列的特點

2.1. 採用非同步處理模式

訊息傳送者 可以傳送一個訊息而無須等待響應。訊息傳送者 將訊息傳送到一條 虛擬的通道主題佇列)上,訊息接收者訂閱 或是 監聽 該通道。一條資訊可能最終轉發給 一個或多個 訊息接收者,這些接收者都無需對 訊息傳送者 做出 同步迴應。整個過程都是 非同步的

2.2. 應用系統之間解耦合

主要體現在如下兩點:

  1. 傳送者和接受者不必瞭解對方、只需要 確認訊息

  2. 傳送者和接受者 不必同時線上

比如線上交易系統為了保證資料的 最終一致,在 支付系統 處理完成後會把 支付結果 放到 訊息中介軟體 裡,通知 訂單系統 修改 訂單支付狀態。兩個系統是通過訊息中介軟體解耦的。

3. 訊息佇列的傳遞服務模型

訊息佇列的 傳遞服務模型 如下圖所示:

淺談訊息佇列及常見的訊息中介軟體

4. 訊息佇列的的傳輸模式

4.1. 點對點模型

點對點模型 用於 訊息生產者訊息消費者 之間 點到點 的通訊。訊息生產者將訊息傳送到由某個名字標識的特定消費者。這個名字實際上對於消費服務中的一個 佇列Queue),在訊息傳遞給消費者之前它被 儲存 在這個佇列中。佇列訊息 可以放在 記憶體 中也可以 持久化,以保證在訊息服務出現故障時仍然能夠傳遞訊息。

傳統的點對點訊息中介軟體通常由 訊息佇列服務訊息傳遞服務訊息佇列訊息應用程式介面 API 組成,其典型的結構如下圖所示。

淺談訊息佇列及常見的訊息中介軟體

特點:

  1. 每個訊息只用一個消費者;
  2. 傳送者和接受者沒有時間依賴;
  3. 接受者確認訊息接受和處理成功。

示意圖如下所示:

淺談訊息佇列及常見的訊息中介軟體

4.2. 釋出/訂閱模型(Pub/Sub)

釋出者/訂閱者 模型支援向一個特定的 訊息主題 生產訊息。0多個訂閱者 可能對接收來自 特定訊息主題 的訊息感興趣。

在這種模型下,釋出者和訂閱者彼此不知道對方,就好比是匿名公告板。這種模式被概況為:多個消費者可以獲得訊息,在 釋出者訂閱者 之間存在 時間依賴性。釋出者需要建立一個 訂閱subscription),以便能夠消費者訂閱。訂閱者 必須保持 持續的活動狀態接收訊息

在這種情況下,在訂閱者 未連線時,釋出的訊息將在訂閱者 重新連線重新發布,如下圖所示:

淺談訊息佇列及常見的訊息中介軟體

特性:

  1. 每個訊息可以有多個訂閱者;
  2. 客戶端只有訂閱後才能接收到訊息;
  3. 持久訂閱和非持久訂閱。

注意:

  1. 釋出者和訂閱者有時間依賴:接受者和釋出者只有建立訂閱關係才能收到訊息;
  2. 持久訂閱:訂閱關係建立後,訊息就不會消失,不管訂閱者是否都線上;
  3. 非持久訂閱:訂閱者為了接受訊息,必須一直線上。 當只有一個訂閱者時約等於點對點模式

5. 訊息佇列應用場景

當你需要使用 訊息佇列 時,首先需要考慮它的必要性。可以使用訊息佇列的場景有很多,最常用的幾種,是做 應用程式鬆耦合非同步處理模式釋出與訂閱最終一致性錯峰流控日誌緩衝 等。反之,如果需要 強一致性,關注業務邏輯的處理結果,則使用 RPC 顯得更為合適。

5.1. 非同步處理

非核心 流程 非同步化,減少系統 響應時間,提高 吞吐量。例如:簡訊通知終端狀態推送App 推送使用者註冊 等。

訊息佇列 一般都內建了 高效的通訊機制,因此也可以用於單純的訊息通訊,比如實現 點對點訊息佇列 或者 聊天室 等。

應用案例

網站使用者註冊,註冊成功後會過一會傳送郵件確認或者短息。

淺談訊息佇列及常見的訊息中介軟體

5.2. 系統解耦

  • 系統之間不是 強耦合的訊息接受者 可以隨意增加,而不需要修改 訊息傳送者的程式碼訊息傳送者 的成功不依賴 訊息接受者(比如:有些銀行介面不穩定,但呼叫方並不需要依賴這些介面)。

  • 不強依賴 於非本系統的核心流程,對於 非核心流程,可以放到訊息佇列中讓 訊息消費者 去按需消費,而 不影響核心主流程

5.3. 最終一致性

最終一致性 不是 訊息佇列 的必備特性,但確實可以依靠 訊息佇列 來做 最終一致性 的事情。

  • 先寫訊息再操作,確保操作完成後再修改訊息狀態。定時任務補償機制 實現訊息 可靠傳送接收、業務操作的可靠執行,要注意 訊息重複冪等設計

  • 所有不保證 100% 不丟訊息 的訊息佇列,理論上無法實現 最終一致性

Kafka 一類的設計,在設計層面上就有 丟訊息 的可能(比如 定時刷盤,如果掉電就會丟訊息)。哪怕只丟千分之一的訊息,業務也必須用其他的手段來保證結果正確。

5.4. 廣播

生產者/消費者 模式,只需要關心訊息是否 送達佇列,至於誰希望訂閱和需要消費,是 下游 的事情,無疑極大地減少了開發和聯調的工作量。

淺談訊息佇列及常見的訊息中介軟體

5.5. 流量削峰和流控

上下游系統 處理能力存在差距的時候,利用 訊息佇列 做一個通用的 “漏斗”,進行 限流控制。在下游有能力處理的時候,再進行分發。

舉個例子:使用者在支付系統成功結賬後,訂單系統會通過簡訊系統向使用者推送扣費通知。 簡訊系統 可能由於 短板效應,速度卡在 閘道器 上(每秒幾百次請求),跟 前端的併發量 不是一個數量級。 於是,就造成 支付系統簡訊系統 的處理能力出現差異化。

然而使用者晚上個半分鐘左右收到簡訊,一般是不會有太大問題的。如果沒有訊息佇列,兩個系統之間通過 協商滑動視窗 等複雜的方案也不是說不能實現。但 系統複雜性 指數級增長,勢必在 上游 或者 下游儲存,並且要處理 定時擁塞 等一系列問題。而且每當有 處理能力有差距 的時候,都需要 單獨 開發一套邏輯來維護這套邏輯。

所以,利用中間系統轉儲兩個系統的通訊內容,並在下游系統有能力處理這些訊息的時候,再處理這些訊息,是一套相對較通用的方式。

應用案例

  1. 把訊息佇列當成可靠的 訊息暫存地,進行一定程度的 訊息堆積
  2. 定時進行訊息投遞,比如模擬 使用者秒殺 訪問,進行 系統效能壓測

淺談訊息佇列及常見的訊息中介軟體

5.6. 日誌處理

將訊息佇列用在 日誌處理 中,比如 Kafka 的應用,解決 海量日誌 傳輸和緩衝的問題。

應用案例

把日誌進行集中收集,用於計算 PV使用者行為分析 等等。

淺談訊息佇列及常見的訊息中介軟體

5.7. 訊息通訊

訊息佇列一般都內建了 高效的通訊機制,因此也可以用於單純的 訊息通訊,比如實現 點對點訊息佇列 或者 聊天室 等。

6. 訊息佇列的推拉模型

6.1. Push推訊息模型

訊息生產者 將訊息傳送給 訊息佇列訊息佇列 又將訊息推給 訊息消費者

6.2. Pull拉訊息模型

消費者 請求 訊息佇列 接受訊息,訊息生產者訊息佇列 中拉該訊息。

6.3. 兩種型別的區別

淺談訊息佇列及常見的訊息中介軟體

7. 訊息佇列技術對比

本部分主要介紹四種常用的訊息佇列(ActiveMQ / RabbitMQ / RocketMQ / Kafka)的主要特性、優點、缺點。

7.1. ActiveMQ

ActiveMQ 是由 Apache 出品,ActiveMQ 是一個完全支援JMS1.1J2EE 1.4 規範的 JMS Provider 實現。它非常快速,支援 多種語言的客戶端協議,而且可以非常容易的嵌入到企業的應用環境中,並有許多高階功能。

淺談訊息佇列及常見的訊息中介軟體

(a) 主要特性

  1. 服從JMS規範JMS 規範提供了良好的標準和保證,包括:同步非同步 的訊息分發,一次和僅一次的訊息分發,訊息接收訂閱 等等。遵從 JMS 規範的好處在於,不論使用什麼 JMS 實現提供者,這些基礎特性都是可用的;

  2. 連線靈活性ActiveMQ 提供了廣泛的 連線協議,支援的協議有:HTTP/SIP 多播SSLTCPUDP 等等。對眾多協議的支援讓 ActiveMQ 擁有了很好的靈活性;

  3. 支援的協議種類多OpenWireSTOMPRESTXMPPAMQP

  4. 持久化外掛和安全外掛ActiveMQ 提供了 多種持久化 選擇。而且,ActiveMQ 的安全性也可以完全依據使用者需求進行 自定義鑑權授權

  5. 支援的客戶端語言種類多:除了 Java 之外,還有:C/C++.NETPerlPHPPythonRuby

  6. 代理叢集:多個 ActiveMQ 代理 可以組成一個 叢集 來提供服務;

  7. 異常簡單的管理ActiveMQ 是以開發者思維被設計的。所以,它並不需要專門的管理員,因為它提供了簡單又使用的管理特性。有很多中方法可以 監控 ActiveMQ 不同層面的資料,包括使用在 JConsole 或者在 ActiveMQWeb Console 中使用 JMX。通過處理 JMX 的告警訊息,通過使用 命令列指令碼,甚至可以通過監控各種型別的 日誌

(b) 部署環境

ActiveMQ 可以執行在 Java 語言所支援的平臺之上。使用 ActiveMQ 需要:

  • Java JDK
  • ActiveMQ 安裝包

(c) 優點

  1. 跨平臺 (JAVA 編寫與平臺無關,ActiveMQ 幾乎可以執行在任何的 JVM 上);

  2. 可以用 JDBC:可以將 資料持久化 到資料庫。雖然使用 JDBC 會降低 ActiveMQ 的效能,但是資料庫一直都是開發人員最熟悉的儲存介質;

  3. 支援 JMS 規範:支援 JMS 規範提供的 統一介面;

  4. 支援 自動重連錯誤重試機制

  5. 有安全機制:支援基於 shirojaas 等多種 安全配置機制,可以對 Queue/Topic 進行 認證和授權

  6. 監控完善:擁有完善的 監控,包括 Web ConsoleJMXShell 命令列,JolokiaRESTful API

  7. 介面友善:提供的 Web Console 可以滿足大部分情況,還有很多 第三方的元件 可以使用,比如 hawtio

(d) 缺點

  1. 社群活躍度不及 RabbitMQ 高;

  2. 根據其他使用者反饋,會出莫名其妙的問題,會 丟失訊息

  3. 目前重心放到 activemq 6.0 產品 Apollo,對 5.x 的維護較少;

  4. 不適合用於 上千個佇列 的應用場景;

7.2. RabbitMQ

RabbitMQ2007 年釋出,是一個在 AMQP (高階訊息佇列協議)基礎上完成的,可複用的企業訊息系統,是當前最主流的訊息中介軟體之一。

淺談訊息佇列及常見的訊息中介軟體

(a) 主要特性

  1. 可靠性:提供了多種技術可以讓你在 效能可靠性 之間進行 權衡。這些技術包括 永續性機制投遞確認釋出者證實高可用性機制

  2. 靈活的路由:訊息在到達佇列前是通過 交換機 進行 路由 的。RabbitMQ 為典型的路由邏輯提供了 多種內建交換機 型別。如果你有更復雜的路由需求,可以將這些交換機組合起來使用,你甚至可以實現自己的交換機型別,並且當做 RabbitMQ外掛 來使用;

  3. 訊息叢集:在相同區域網中的多個 RabbitMQ 伺服器可以 聚合 在一起,作為一個獨立的邏輯代理來使用;

  4. 佇列高可用:佇列可以在叢集中的機器上 進行映象,以確保在硬體問題下還保證 訊息安全

  5. 支援多種協議:支援 多種訊息佇列協議

  6. 支援多種語言:用 Erlang 語言編寫,支援只要是你能想到的 所有程式語言

  7. 管理介面RabbitMQ 有一個易用的 使用者介面,使得使用者可以 監控管理 訊息 Broker 的許多方面;

  8. 跟蹤機制:如果 訊息異常RabbitMQ 提供訊息跟蹤機制,使用者可以找出發生了什麼;

  9. 外掛機制:提供了許多 外掛,來從多方面進行擴充套件,也可以編寫自己的外掛。

(b) 部署環境

RabbitMQ 可以執行在 Erlang 語言所支援的平臺之上,包括 SolarisBSDLinuxMacOSXTRU64Windows 等。使用 RabbitMQ 需要:

  • ErLang 語言包
  • RabbitMQ 安裝包

(c) 優點

  1. 由於 Erlang 語言的特性,訊息佇列效能較好,支援 高併發

  2. 健壯、穩定、易用、跨平臺、支援 多種語言、文件齊全;

  3. 有訊息 確認機制持久化機制,可靠性高;

  4. 高度可定製的 路由

  5. 管理介面 較豐富,在網際網路公司也有較大規模的應用,社群活躍度高。

(d) 缺點

  1. 儘管結合 Erlang 語言本身的併發優勢,效能較好,但是不利於做 二次開發和維護

  2. 實現了 代理架構,意味著訊息在傳送到客戶端之前可以在 中央節點 上排隊。此特性使得 RabbitMQ 易於使用和部署,但是使得其 執行速度較慢,因為中央節點 增加了延遲訊息封裝後 也比較大;

  3. 需要學習 比較複雜介面和協議,學習和維護成本較高。

7.3. RocketMQ

RocketMQ 出自 阿里 的開源產品,用 Java 語言實現,在設計時參考了 Kafka,並做出了自己的一些改進,訊息可靠性上Kafka 更好。RocketMQ 在阿里內部被廣泛應用在 訂單交易充值流計算訊息推送日誌流式處理binglog 分發 等場景。

(a) 主要特性

淺談訊息佇列及常見的訊息中介軟體

  1. 基於 佇列模型:具有 高效能高可靠高實時分散式 等特點;

  2. ProducerConsumer佇列 都支援 分散式

  3. Producer 向一些佇列輪流傳送訊息,佇列集合 稱為 TopicConsumer 如果做 廣播消費,則一個 Consumer 例項消費這個 Topic 對應的 所有佇列;如果做 叢集消費,則 多個 Consumer 例項 平均消費 這個 Topic 對應的佇列集合;

  4. 能夠保證 嚴格的訊息順序

  5. 提供豐富的 訊息拉取模式

  6. 高效的訂閱者 水平擴充套件能力;

  7. 實時訊息訂閱機制

  8. 億級 訊息堆積 能力;

  9. 較少的外部依賴。

(b) 部署環境

RocketMQ 可以執行在 Java 語言所支援的平臺之上。使用 RocketMQ 需要:

  • Java JDK
  • 安裝 gitMaven
  • RocketMQ 安裝包

(c) 優點

  1. 單機 支援 1 萬以上 持久化佇列

  2. RocketMQ 的所有訊息都是 持久化的,先寫入系統 PAGECACHE,然後 刷盤,可以保證 記憶體磁碟 都有一份資料,而 訪問 時,直接 從記憶體讀取

  3. 模型簡單,介面易用(JMS 的介面很多場合並不太實用);

  4. 效能非常好,可以允許 大量堆積訊息Broker 中;

  5. 支援 多種消費模式,包括 叢集消費廣播消費等;

  6. 各個環節 分散式擴充套件設計,支援 主從高可用

  7. 開發度較活躍,版本更新很快。

(d) 缺點

  1. 支援的 客戶端語言 不多,目前是 JavaC++,其中 C++ 還不成熟;

  2. RocketMQ 社群關注度及成熟度也不及前兩者;

  3. 沒有 Web 管理介面,提供了一個 CLI (命令列介面) 管理工具帶來 查詢管理診斷各種問題

  4. 沒有在 MQ 核心裡實現 JMS 等介面;

7.4. Kafka

Apache Kafka 是一個 分散式訊息釋出訂閱 系統。它最初由 LinkedIn 公司基於獨特的設計實現為一個 分散式的日誌提交系統 (a distributed commit log),之後成為 Apache 專案的一部分。Kafka 效能高效可擴充套件良好 並且 可持久化。它的 分割槽特性可複製可容錯 都是其不錯的特性。

淺談訊息佇列及常見的訊息中介軟體

(a) 主要特性

  1. 快速持久化:可以在 O(1) 的系統開銷下進行 訊息持久化

  2. 高吞吐:在一臺普通的伺服器上既可以達到 10W/s吞吐速率

  3. 完全的分散式系統BrokerProducerConsumer 都原生自動支援 分散式,自動實現 負載均衡

  4. 支援 同步非同步 複製兩種 高可用機制

  5. 支援 資料批量傳送拉取

  6. 零拷貝技術(zero-copy):減少 IO 操作步驟,提高 系統吞吐量

  7. 資料遷移擴容 對使用者透明;

  8. 無需停機 即可擴充套件機器;

  9. 其他特性:豐富的 訊息拉取模型、高效 訂閱者水平擴充套件、實時的 訊息訂閱、億級的 訊息堆積能力、定期刪除機制;

(b) 部署環境

使用 Kafka 需要:

  • Java JDK
  • Kafka 安裝包

(c) 優點

  1. 客戶端語言豐富:支援 Java.NetPHPRubyPythonGo 等多種語言;

  2. 高效能:單機寫入 TPS 約在 100 萬條/秒,訊息大小 10 個位元組;

  3. 提供 完全分散式架構,並有 replica 機制,擁有較高的 可用性可靠性,理論上支援 訊息無限堆積

  4. 支援批量操作;

  5. 消費者 採用 Pull 方式獲取訊息。訊息有序通過控制 能夠保證所有訊息被消費且僅被消費 一次

  6. 有優秀的第三方 Kafka Web 管理介面 Kafka-Manager

  7. 日誌領域 比較成熟,被多家公司和多個開源專案使用。

(d) 缺點

  1. Kafka 單機超過 64佇列/分割槽 時,Load 時會發生明顯的飆高現象。佇列 越多,負載 越高,傳送訊息 響應時間變長

  2. 使用 短輪詢方式實時性 取決於 輪詢間隔時間

  3. 消費失敗 不支援重試

  4. 支援 訊息順序,但是 一臺代理當機 後,就會產生 訊息亂序

  5. 社群更新較慢。

7.5. 幾種訊息佇列對比

這裡列舉了上述四種訊息佇列的差異對比:

淺談訊息佇列及常見的訊息中介軟體

Kafka 在於 分散式架構RabbitMQ 基於 AMQP 協議 來實現,RocketMQ 的思路來源於 Kafka,改成了 主從結構,在 事務性可靠性 方面做了優化。廣泛來說,電商金融 等對 事務一致性 要求很高的,可以考慮 RabbitMQRocketMQ,對 效能要求高 的可考慮 Kafka

小結

本文介紹了訊息佇列的特點,訊息佇列的 傳遞服務模型,訊息的 傳輸方式,訊息的 推拉模式。然後介紹了 ActiveMQRabbitMQRocketMQKafka 幾種常見的訊息佇列,闡述了 各種訊息佇列主要特點優缺點。通過本文,對於訊息佇列及相關技術選型,相信你會有了更深入的理解和認識。更多細節和原理性的東西,還需在實踐中見真知!


歡迎關注技術公眾號: 零壹技術棧

零壹技術棧

本帳號將持續分享後端技術乾貨,包括虛擬機器基礎,多執行緒程式設計,高效能框架,非同步、快取和訊息中介軟體,分散式和微服務,架構學習和進階等學習資料和文章。

相關文章