Java面試—訊息佇列
訊息佇列面試題
1. 為什麼要引入訊息佇列?
訊息佇列的引入可以解決3個核心問題:
- 解耦
- 非同步
- 削峰
- 解耦
在一個專案中,如果一個模組A產生的一個關鍵資料,需要呼叫其他模組介面服務;而需要呼叫的介面很多,又不確定之後是否還需要將資料傳給其他模組的介面時。這時可以使用訊息佇列,使用了訊息佇列之後,模組A不需要在對接各個模組,而是直接對接訊息佇列。這樣一來。當其他的模組需要這個資料時,也不用再修改A資料,而是去到MQ中訂閱這個Topic。使得模組A與其他模組之間耦合度降低。
- 非同步
在一個專案中,如果模組A的請求處理需要20ms,而模組A又依賴了模組B,模組C ,模組D 。在A請求處理結束後,A需要呼叫
模組B,C,D的對應請求處理,這時B請求處理需要100ms,C 需要200ms,D 需要400ms。這樣一來,總體一個請求的總時長為
20 + 100 + 200 + 400 = 720 ms 遠遠大於模組A的請求處理時間。另一方面,模組B 模組C 模組D之間 並沒有順序關係。
這時可以引入訊息佇列 ,模組A在請求處理結束後,將自己的資料傳送給訊息佇列MQ,由B,C ,D去訊息佇列獲取資料,自行處理
模組A在處理完成後直接返回給客戶端處理結果,而不需要等待B,C,D處理結束,如此一來,一個請求處理的就只需要計算
模組A的處理時間=20ms,大大提高了使用者體驗。
- 削峰
如果一個系統只能一秒鐘處理5000個請求(MySQL一般只能2000QPS),而在特殊時期就只要1個小時的時間段內,請求量暴漲,一秒鐘來了1W個請求。從而系統會之間當機。但這種情況可能在平時不會發生,不需要升級相應的伺服器配置。
問題在於在1小時的時間段,如何把請求從10000QPS 下降到5000QPS 使得系統能夠正常運轉而不發生當機。
這時候可以引入訊息佇列,假設模組A負責處理請求,模組B負責將資料持久化到資料庫。模組A在接受到請求時,把請求交給訊息佇列,由訊息佇列來緩解對應的請求壓力,類似於Buffer建立一個緩衝區,模組B根據自己的請求處理速度去到訊息佇列中去消費資料。這樣一來就解決了對應特定時間段的削峰問題。
- 要結合實際專案來說明:
體現上述的三個點。
2. MQ有什麼缺點?
任何技術都是一把雙刃劍,在引入訊息佇列的同時必定也會伴隨著相應的問題,正如《人月神話》中所說,沒有銀彈。
訊息佇列的引入會帶來3個核心的問題:
3. 你都瞭解過哪些MQ? 他們之間有什麼區別嗎?
這個問題可以延伸為技術選型問題,關於這個問題可以認為憑什麼你選擇了這個MQ,而沒有選擇其他MQ。對應可以擴充套件為spring-security 與shiro 都是安全框架都實現了Oauth2協議,而且shiro是輕量級的,為什麼你選擇了Spring-Security這個安全框架這個問題比較考察技術廣度。
首先我瞭解過的MQ有:activeMQ,RabbitMQ,RocketMQ,Kafka
activeMQ | RabbitMQ | RocketMQ | Kafka | |
---|---|---|---|---|
併發量 | 萬級 | 萬級 | 十萬級 | 萬級 |
處理時長 | 毫秒 | 微妙 | 毫秒 | 毫秒 |
開發語言 | Java | ErLang | Java | Java Scala |
功能完備 | 完備 | 完備 且提供了外掛與管理介面 | 完備 | 完備 |
常用場景 | 小型專案demo | * | * | 大資料領域日誌處理、實時計算 |
社群活躍度 | 較低 | 高 | 高 | 高 |
activeMQ社群活躍度較低,不建議使用。
RabbitMQ社群活躍度高,更新版本頻繁,但使用開發語言為ErLang , 當有定製化需求無法進行擴充套件
RocketMQ 阿里出品,但存在著後續專案不更新情況,這就使得企業自行維護相應的功能或者定製化功能
Kafka 大資料領域 主要用來進行實時計算,日誌採集的訊息佇列,功能相比於其他MQ少,但是kafka是大資料領域公認的訊息佇列
如果對功能有要求,小公司可以選擇RabbitMQ, 有技術團隊的大公司可以使用RocketMQ,大資料生態為了與其他元件配合所以使用Kafka
4. 如何保證MQ的高可用
- RabbitMQ的HA
RabbitMQ的解決方式為=>叢集模式 + 映象
普通叢集模式:
queue建立之後,如果沒有其它policy(策略),則queue就會按照普通模式叢集。對於Queue來說,訊息實體只存在於其中一個節點,A、B兩個節點僅有相同的後設資料,即佇列結構,但佇列的後設資料僅儲存有一份,即建立該佇列的rabbitmq節點(A節點),當A節點當機,你可以去其B節點檢視,./rabbitmqctl list_queues發現該佇列已經丟失,但宣告的exchange還存在。
當訊息進入A節點的Queue中後,consumer從B節點拉取時,RabbitMQ會臨時在A、B間進行訊息傳輸,把A中的訊息實體取出並經過B傳送給consumer,所以consumer應平均連線每一個節點,從中取訊息。
該模式存在一個問題就是當A節點故障後,B節點無法取到A節點中還未消費的訊息實體。如果做了佇列持久化或訊息持久化,那麼得等A節點恢復,然後才可被消費,並且在A節點恢復之前其它節點不能再建立A節點已經建立過的持久佇列;如果沒有持久化的話,訊息就會失丟。這種模式更適合非持久化佇列。
只有該佇列是非持久的,客戶端才能重新連線到叢集裡的其他節點,並重新建立佇列。
假如該佇列是持久化的,那麼唯一辦法是將故障節點恢復起來。
映象叢集模式:
核心在於:映象叢集會同步訊息
該模式解決了上述問題,其實質和普通模式不同之處在於,訊息實體會主動在映象節點間同步,而不是在consumer取資料時臨時拉取。該模式帶來的副作用也很明顯,除了降低系統效能外,如果映象佇列數量過多,加之大量的訊息進入,叢集內部的網路頻寬將會被這種同步通訊大大消耗掉。所以在對可靠性要求較高的場合中適用,
一個佇列想做成映象佇列,需要先設定policy,然後客戶端建立佇列的時候,rabbitmq叢集根據“佇列名稱”自動設定是普通叢集模式或映象佇列。但這不是分散式儲存,而是多節點主備儲存。相比於Kafka的分散式架構會多消耗資源。 - Kafka實現高可用
Kafka的高可用主要是透過Kafka透過把每個Topic中的訊息分成多個Partition,每個Partition做一個叢集。而每一個Partition內部叢集透過選舉得到一個leader,其他是follower,leader複製訊息的讀寫,並把訊息複製到follower。Kafka在傳送訊息時,只有當每個partition的follower複製到了訊息才確認訊息已經被儲存。
5. 如何保證訊息不會丟失?
- RabbitMQ方式
1.1 生產者方面- 開啟RabbitMQ的事務方式txSelect()。當生產者寫入訊息失敗時,採取重試機制。但這個寫入是同步的。
- 使用confirm方式: 其中confirm也可以使用三種方式:
- 普通confirm
- 批次confirm
- 非同步confirm 設定監聽器
channel.confirmSelect();
//普通confirm
if (channel.waitForConfirms()) {
System.out.println("訊息傳送成功" );
}
//批次confirm 失敗會報錯
channel.waitForConfirmsOrDie();
//非同步監聽confirm
channel.addConfirmListener(new ConfirmListener() {
@Override
public void handleNack(long deliveryTag, boolean multiple) throws IOException {
System.out.println("未確認訊息,標識:" + deliveryTag);
}
@Override
public void handleAck(long deliveryTag, boolean multiple) throws IOException {
System.out.println(String.format("已確認訊息,標識:%d,多個訊息:%b", deliveryTag, multiple));
}
});
1.2 RabbitMQ方面
RabbitMQ在記憶體快取訊息,當MQ當機時,會發生訊息丟失現象。這一點需要RabbitMQ將訊息持久化到硬碟上。減小訊息丟失的可能
1.3 消費者方面
RabbitMQ預設是autoAck=true,這樣就使得消費者在接受到訊息時,立馬告知MQ我消費了資料,但還沒有來得及處理。所以需要把autoAck=false,之後當訊息處理完成之後手動提交。
2 kafka方面
- 生產端
資料丟失傳送在leader向follower同步訊息的時候,leader當機使得訊息丟失。
解決方案是設定4個引數:- replication.factor = n > 1 設定partition有多少個副本數
- kafka咋服務端設定mini.sync.replicas=1 即一個leader至少保證有一個follower存活
- producer在傳送訊息時,設定acks=all 設定所有訊息必須全部寫入replication後返回成功。
- retries=Integer.MAX 把重試次數調製最大
- 消費端
在消費者端關閉自動確認訊息,這樣需要手動確認 保證訊息不會丟失。
6. 如何保證訊息不會重複消費?
- 在消費者消費訊息時,把對應的唯一值放入HashSet 或者Redis來避免同一條訊息消費多次
- 使用資料庫的唯一鍵約束來報錯處理
7. 如何保證消費者消費訊息時訊息的順序性?
訊息佇列本身就是為了把多個任務解耦並行化處理,如果要保證訊息的順序訊息,實際上就是取消並行處理,改成序列處理。
- RabbitMQ
將一組訊息放入同一個queue,這樣就只會有一個consumer來消費這個queue中的資料,在consumer內部採用佇列的方式來處理順序訊息 - Kafka
生產者寫訊息時,每次寫入一個topic,將partition對應key值修改同一key,這樣訊息只會進入一個partition,也只有一個消費者在進行消費,之後也採用記憶體佇列的方式順序處理訊息。
8. 訊息佇列積壓太多,目前消費者處理太慢,如何改進?
目前的消費者難以在短時間內處理這麼多條訊息,考慮引入多個消費者,但引入這多個消費者只用於消費當前訊息,並不是長期使用。假定長期使用的消費者為A、B、C 訂閱的Topic是Order。新申請3 * 10~20 = 30~60個機器 作為新的消費者組GroupNew。 GroupNew 訂閱新的Topic - OrderFast,從這個topic中獲取訊息並消費。將原有長期使用的消費者組修改程式碼,不處理訊息 直接將訊息寫入到新的Topic - OrderFast
9. 訊息佇列的機器磁碟快被訊息寫滿了怎麼辦?
- 可以採取上述方案,不同的是寫入到另外一臺MQ中,而不是在本機的Topic
- 下一個訊息直接丟棄不處理,到訊息佇列機器恢復之後,將生產者與消費者之間透過程式碼查詢出對應的缺失部分,再進行補償式操作。
10. 訊息佇列消費訊息太慢,訊息過期失效怎麼辦?
- 生產環境設定訊息不過期
- 如果已經過期失效,那麼需要查出過期失效的訊息,重新進行補償式操作
本文由部落格一文多發平臺 釋出!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2730/viewspace-2824951/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Java訊息佇列三道面試題詳解!Java佇列面試題
- 訊息佇列常見面試題佇列面試題
- 訊息佇列面試解析 - 傳輸協議佇列面試協議
- 阿里最新38道Java面試題解析(MyBatis+訊息佇列+Redis)阿里Java面試題MyBatis佇列Redis
- 阿里Java面試題剖析:為什麼使用訊息佇列?訊息佇列有什麼優點和缺點?阿里Java面試題佇列
- 訊息佇列系列一:訊息佇列應用佇列
- 高併發架構訊息佇列面試題解析架構佇列面試題
- 訊息佇列佇列
- 22面試常問:為什麼需要訊息佇列?使用訊息佇列有什麼好處?面試佇列
- AMQP訊息佇列的測試方法MQ佇列
- 面試題剖析,如何保證訊息佇列的高可用?面試題佇列
- RabbitMQ 訊息佇列之佇列模型MQ佇列模型
- [Redis]訊息佇列Redis佇列
- [訊息佇列]rocketMQ佇列MQ
- [訊息佇列]RabbitMQ佇列MQ
- RabbitMQ訊息佇列MQ佇列
- Kafka訊息佇列Kafka佇列
- 訊息佇列(MQ)佇列MQ
- kafka 訊息佇列Kafka佇列
- 全面理解Handler-1:理解訊息佇列,手寫訊息佇列佇列
- 訊息佇列之RocketMQ佇列MQ
- MQ訊息佇列_RabbitMQMQ佇列
- 訊息佇列之RabbitMQ佇列MQ
- 訊息佇列簡史佇列
- 訊息佇列雜談佇列
- 訊息佇列設計佇列
- rabbitmq訊息佇列原理MQ佇列
- 訊息佇列之 RocketMQ佇列MQ
- 訊息佇列二三事佇列
- 訊息佇列深入解析佇列
- 訊息佇列之 ActiveMQ佇列MQ
- RabbitMQ訊息佇列(五):Routing 訊息路由MQ佇列路由
- 程式間通訊--訊息佇列佇列
- 分散式服務(RPC)+分散式訊息佇列(MQ)面試題精選分散式RPC佇列MQ面試題
- 訊息機制篇——初識訊息與訊息佇列佇列
- [Redis]延遲訊息佇列Redis佇列
- 訊息佇列 大雜燴佇列
- Python使用RocketMQ(訊息佇列)PythonMQ佇列