高可用服務 AHAS 在訊息佇列 MQ 削峰填穀場景下的應用

許此一生發表於2019-03-14

原文網址 : https://juejin.im/post/5c89ff91f265da2db073d0db

在訊息佇列中，當消費者去消費訊息的時候，無論是通過 pull 的方式還是 push 的方式，都可能會出現大批量的訊息突刺。如果此時要處理所有訊息，很可能會導致系統負載過高，影響穩定性。但其實可能後面幾秒之內都沒有訊息投遞，若直接把多餘的訊息丟掉則沒有充分利用系統處理訊息的能力。我們希望可以把訊息突刺均攤到一段時間內，讓系統負載保持在訊息處理水位之下的同時儘可能地處理更多訊息，從而起到“削峰填谷”的效果：

上圖中紅色的部分代表超出訊息處理能力的部分。

我們可以看到訊息突刺往往都是瞬時的、不規律的，其後一段時間系統往往都會有空閒資源。我們希望把紅色的那部分訊息平攤到後面空閒時去處理，這樣既可以保證系統負載處在一個穩定的水位，又可以儘可能地處理更多訊息，這時候我們就需要一個能夠控制消費端訊息勻速處理的利器 — AHAS 流控降級，來為訊息佇列削峰填谷，保駕護航。

AHAS 是如何削峰填谷的

AHAS 的流控降級是面向分散式服務架構的專業流量控制元件，主要以流量為切入點，從流量控制、熔斷降級、系統保護等多個維度來幫助您保障服務的穩定性，同時提供強大的聚合監控和歷史監控查詢功能。

AHAS 專門為這種場景提供了勻速排隊的控制特性，可以把突然到來的大量請求以勻速的形式均攤，以固定的間隔時間讓請求通過，以穩定的速度逐步處理這些請求，起到“削峰填谷”的效果，從而避免流量突刺造成系統負載過高。同時堆積的請求將會排隊，逐步進行處理；當請求排隊預計超過最大超時時長的時候則直接拒絕，而不是拒絕全部請求。

比如在 RocketMQ 的場景下配置了勻速模式下請求 QPS 為 5，則會每 200 ms 處理一條訊息，多餘的處理任務將排隊；同時設定了超時時間，預計排隊時長超過超時時間的處理任務將會直接被拒絕。示意圖如下圖所示：

RocketMQ Consumer 接入示例

本部分將引導您快速在 RocketMQ 消費端接入 AHAS 流控降級 Sentinel。

1. 開通 AHAS

首先您需要到AHAS 控制檯開通 AHAS 功能（免費）。可以根據開通 AHAS 文件裡面的指引進行開通。

2. 程式碼改造

在結合阿里雲 RocketMQ Client 使用 Sentinel 時，使用者需要引入 AHAS Sentinel 的依賴 ahas-sentinel-client （以 Maven 為例）：

<dependency>    <groupId>com.alibaba.csp</groupId>    <artifactId>ahas-sentinel-client</artifactId>    <version>1.1.0</version></dependency>複製程式碼

由於 RocketMQ Client 未提供相應攔截機制，而且每次收到都可能是批量的訊息，因此使用者在處理訊息時需要手動進行資源定義（埋點）。我們可以在處理訊息的邏輯處手動進行埋點，資源名可以根據需要來確定（如 groupId + topic 的組合）：

    private static Action handleMessage(Message message, String groupId, String topic) {        Entry entry = null;        try {            // 資源名稱為 groupId 和 topic 的組合，便於標識，同時可以針對不同的 groupId 和 topic 配置不同的規則            entry = SphU.entry("handleMqMessage:" + groupId + ":" + topic);                      // 在此處編寫真實的處理邏輯            System.out.println(System.currentTimeMillis() + " | handling message: " + message);            return Action.CommitMessage;        } catch (BlockException ex) {            // 在編寫處理被流控的邏輯            // 示例：可以在此處記錄錯誤或進行重試            System.err.println("Blocked, will retry later: " + message);            return Action.ReconsumeLater; // 會觸發訊息重新投遞        } finally {            if (entry != null) {                entry.exit();            }        }    }複製程式碼

消費者訂閱訊息的邏輯示例：

Consumer consumer = ONSFactory.createConsumer(properties);consumer.subscribe(topic, "*", (message, context) -> {    return handleMessage(message);});consumer.start();複製程式碼

更多關於 RocketMQ SDK 的資訊可以參考訊息佇列 RocketMQ 入門文件。

3. 獲取 AHAS 啟動引數

注意：若在本地執行接入 AHAS Sentinel 控制檯需要在頁面左上角選擇公網環境，若在阿里雲 ECS 環境則在頁面左上角選擇對應的 Region 環境。

我們可以進入 AHAS 控制檯，點選左側側邊欄的 流控降級，進入 AHAS 流控降級控制檯應用總覽頁面。在頁面右上角，單擊新增應用，選擇 SDK 接入頁籤，到 配置啟動引數 頁籤拿到需要的啟動引數（詳情請參考 SDK 接入文件），類似於：

-Dproject.name=AppName -Dahas.license=<License>複製程式碼

其中 project.name 配置項代表應用名（會顯示在控制檯，比如 MqConsumerDemo），ahas.license 配置項代表自己的授權 license（ECS 環境不需要此項）。

4. 啟動 Consumer，配置規則

接下來我們新增獲取到的啟動引數，啟動修改好的 Consumer 應用。由於 AHAS 流控降級需要進行資源呼叫才能觸發初始化，因此首先需要向對應 group/topic 傳送一條訊息觸發初始化。消費端接收到訊息後，我們就可以在 AHAS Sentinel 控制檯上看到我們的應用了。點選應用卡片，進入詳情頁面後點選左側側邊欄的“機器列表”。我們可以在機器列表頁面看到剛剛接入的機器，代表接入成功：

點選“請求鏈路”頁面，我們可以看到之前定義的資源。點選右邊的“流控”按鈕新增新的流控規則：

我們在“流控方式”中選擇“排隊等待”，設定 QPS 為 10，代表每 100ms 勻速通過一個請求；並且設定最大超時時長為 2000ms，超出此超時時間的請求將不會排隊，立即拒絕。配置完成後點選新建按鈕。

5. 傳送訊息，檢視效果

下面我們可以在 Producer 端批量傳送訊息，然後在 Consumer 端的控制檯輸出處觀察效果。可以看到訊息消費的速率是勻速的，大約每 100 ms 消費一條訊息：

同時不斷有排隊的處理任務完成，超出等待時長的處理請求直接被拒絕。注意在處理請求被拒絕的時候，需要根據需求決定是否需要重新消費訊息。

我們也可以點選左側側邊欄的“監控詳情”進入監控詳情頁面，檢視處理訊息的監控曲線：

對比普通限流模式的監控曲線（最右面的部分）：

如果不開啟勻速模式，只是普通的限流模式，則只會同時處理 10 條訊息，其餘的全部被拒絕，即使後面的時間系統資源充足多餘的請求也無法被處理，因而浪費了許多空閒資源。兩種模式對比說明勻速模式下訊息處理能力得到了更好的利用。

Kafka 接入程式碼示例

Kafka 消費端接入 AHAS 流控降級的思路與上面的 RocketMQ 類似，這裡給出一個簡單的程式碼示例：

private static void handleMessage(ConsumerRecord<String, String> record, String groupId, String topic) {    pool.submit(() -> {        Entry entry = null;        try {            // 資源名稱為 groupId 和 topic 的組合，便於標識，同時可以針對不同的 groupId 和 topic 配置不同的規則            entry = SphU.entry("handleKafkaMessage:" + groupId + ":" + topic);             // 在此處理訊息.            System.out.printf("[%d] Receive new messages: %s%n", System.currentTimeMillis(), record.toString());        } catch (BlockException ex) {            // Blocked.            // NOTE: 在處理請求被拒絕的時候，需要根據需求決定是否需要重新消費訊息            System.err.println("Blocked: " + record.toString());        } finally {            if (entry != null) {                entry.exit();            }        }    });}複製程式碼

消費訊息的邏輯：

while (true) {    try {        ConsumerRecords<String, String> records = consumer.poll(1000);        // 必須在下次 poll 之前消費完這些資料, 且總耗時不得超過 SESSION_TIMEOUT_MS_CONFIG        // 建議開一個單獨的執行緒池來消費訊息，然後非同步返回結果        for (ConsumerRecord<String, String> record : records) {            handleMessage(record, groupId, topic);        }    } catch (Exception e) {        try {            Thread.sleep(1000);        } catch (Throwable ignore) {        }        e.printStackTrace();    }}複製程式碼

其它

以上介紹的只是 AHAS 流控降級的其中一個場景 —— 請求勻速，它還可以處理更復雜的各種情況，比如：

流量控制：可以針對不同的呼叫關係，以不同的執行指標（如 QPS、執行緒數、系統負載等）為基準，對資源呼叫進行流量控制，將隨機的請求調整成合適的形狀（請求勻速、Warm Up 等）。
熔斷降級：當呼叫鏈路中某個資源出現不穩定的情況，如平均 RT 增高、異常比例升高的時候，會使對此資源的呼叫請求快速失敗，避免影響其它的資源導致級聯失敗。
系統負載保護：對系統的維度提供保護。當系統負載較高的時候，提供了對應的保護機制，讓系統的入口流量和系統的負載達到一個平衡，保證系統在能力範圍之內處理最多的請求。

您可以參考 AHAS 流控降級文件來挖掘更多的場景。

作者：中介軟體小哥
 原文連結

MQ 訊息佇列的解耦、介面非同步處理、削峰
2019-11-12
MQ佇列解耦非同步
訊息佇列MQ應用場景及主流框架對比
2019-05-08
佇列MQ框架
主流的訊息佇列MQ比較，詳解MQ的4類應用場景
2021-09-09
佇列MQ
配置管理 ACM 在高可用服務 AHAS 流控降級元件中的應用場景
2019-03-14
ACM元件
MQ系列8：資料儲存，訊息佇列的高可用保障
2022-11-26
MQ佇列
訊息佇列（MQ）
2019-07-13
佇列MQ
訊息佇列常見的 5 個應用場景
2018-11-24
佇列
訊息佇列常見的5個應用場景
2018-07-30
佇列
訊息佇列的七種經典應用場景
2024-03-28
佇列
MQ訊息佇列_RabbitMQ
2020-02-22
MQ佇列
關於MQ的幾件小事（二）如何保證訊息佇列的高可用
2019-05-22
MQ佇列
訊息佇列mq總結
2018-09-13
佇列MQ
MQ 訊息佇列比較
2023-02-15
MQ佇列
訊息佇列系列一：訊息佇列應用
2021-05-24
佇列
二、如何保證訊息佇列的高可用？
2019-01-07
佇列
訊息佇列的使用場景之kafka
2021-12-11
佇列Kafka
訊息佇列的使用場景之RabbitMQ
2021-12-11
佇列MQ
Spring Boot：使用Rabbit MQ訊息佇列
2019-07-02
Spring BootMQ佇列
分散式服務（RPC）+分散式訊息佇列（MQ）面試題精選
2019-05-04
分散式RPC佇列MQ面試題
手擼MQ訊息佇列——迴圈陣列
2024-09-14
MQ佇列陣列
如何實現MQ佇列訊息監控
2020-09-23
MQ佇列
面試題剖析，如何保證訊息佇列的高可用？
2019-03-18
面試題佇列
關於MQ的幾件小事（六）訊息積壓在訊息佇列裡怎麼辦
2019-05-22
MQ佇列
redis訊息佇列簡單應用
2019-05-06
Redis佇列
Redis 應用-非同步訊息佇列與延時佇列
2019-07-05
Redis非同步佇列
簡述訊息佇列在電商系統使用場景以及工作模式
2021-11-18
佇列模式
訊息中介軟體的應用場景
2021-04-22
win10 訊息佇列服務怎麼開啟_win10怎麼新增訊息佇列
2020-08-17
Win10佇列
更多場景、更多選擇，Milvus 新訊息佇列 NATS 瞭解一下
2023-09-20
佇列
訊息佇列應用在哪些場景裡，這篇文章講得很詳細
2021-12-08
佇列
詳解RPC遠端呼叫和訊息佇列MQ的區別
2019-01-08
RPC佇列MQ
消費端如何保證訊息佇列MQ的有序消費
2019-07-30
佇列MQ
Java訊息佇列：RabbitMQ與Kafka的整合與應用
2024-09-01
Java佇列MQKafka
說說你對棧、佇列的理解？應用場景？
2024-04-11
佇列
Linkedlist的應用場景：設計佇列、設計棧
2024-03-10
佇列
雲搜尋服務在APP搜尋場景的應用
2018-08-28
APP
ThreadX——IPC應用之訊息佇列
2020-12-22
thread佇列
訊息佇列MQ最全詳解(萬字圖文總結)
2024-03-06
佇列MQ