如何用 RocketMQ 打造金融級訊息服務平臺?微眾銀行這麼做

阿里技術_發表於2019-01-09

640?wx_fmt=jpeg

阿里妹導讀近年來,隨著微服務架構的流行,分散式訊息引擎在物聯網、分散式事務、實時計算和大規模快取同步等場景中的應用日益增多。


本文將分享微眾銀行基於RocketMQ構建訊息服務平臺的實踐,通過新增諸多高階特性來解決訊息收發過程中遇到的各種問題。你將瞭解到:金融行業服務架構的演進歷程、微眾銀行的訊息服務架構以及基於RocketMQ定製的訊息高階特性。


銀行應用架構的演進歷史


不管是銀行的系統還是其他一些傳統企業的系統,他們在最早的時候都使用到了服務匯流排,即ESB或者某種形式存在於SOA架構中,目的是把所有的服務都串起來,讓服務之間能夠形成一個呼叫。但這類服務架構其實是比較重的,所有的服務架構都要經過匯流排,匯流排成為了架構上的瓶頸。很多商業化的ESB匯流排大家可能都用過。從服務呼叫的維度來看,銀行的應用架構的演進經歷了以下3個階段。

 

第一階段:90年代中後期分散式架構

 

640?wx_fmt=png

 

這個階段的架構具有以下3個特點:

 

  1. 將總行的集中式系統在各個省分行分別都部署一套,每天晚上再以批量處理的方式將各省資料進行集中。

  2. 這種架構的方式能夠最快的解決聯機效能問題, 但存在跨省轉賬交易無法實時到賬的問題。

  3. 系統釋出的實時性是硬傷。

 

第二階段:2000-2010年集中式匯流排架構


640?wx_fmt=png

 

這個階段引入了ESB匯流排的理念:ESB匯流排為渠道、核心和外圍系統建立了一座橋樑,提供完全統一的介面標準協議,提升了系統釋出的實時性。但同時,ESB成為了最大的單點,要支援大併發高TPS低延時,所以HA和效能要求非常高,變更需要相當謹慎。


第三階段:2010年之後的網際網路金融服務架構

 

640?wx_fmt=png

 

到了2012年以後,隨著各個海外開放平臺獲得的巨大成功,一線網際網路公司都逐步將自己的介面開放出來,並實施了開放平臺生態圈戰略,從而推動了SOA服務化的快速發展。


  • 左邊是之前的傳統銀行集中式匯流排架構,右邊是網際網路服務化架構,包含了開放平臺、服務註冊和發現,以及服務化產品系統。

  • 通過開放平臺對外提供介面暴露,可以發現這種架構在保障傳統銀行系統穩定性的同時也可以滿足網際網路金融需求的快速迭代實施,並且也使用了新興的網際網路分散式技術,來降低開發和運維的成本。


 微眾銀行的訊息服務架構


640?wx_fmt=jpeg

微眾銀行的訊息服務架構

 

微眾銀行基於Apache RocketMQ構建了自己的分散式訊息服務架構,我們以RMB(Reliable Message Bus)為接入層,以基於Apache RocketMQ定製開發的WeMQ(WeBank Message Queue)為訊息服務核心,通過GSL(Global Service Location)進行服務定位,通過SGS(Service Governance System)進行服務請求和服務響應的服務治理,整個分散式鏈路的追蹤日誌會上報到Log中。

 

接下來,我們來看看我們基於RocketMQ改造使用到的常見的訊息服務模式:

 

單播/多播pub-sub模式


Consumer可以是一個或者多個,但是一個訊息會被多個不同系統的其中一個consumer收到。


640?wx_fmt=png

 

廣播pub-sub模式


多個線上的Consumer會同時收到廣播訊息。


640?wx_fmt=png

 

Active/Standby消費模式


生產者只有一個,消費者有多個,但是作為HA,只有一個Active,其他都是StandBy。當Active掛掉一個,Standby會迅速接管。


640?wx_fmt=png

request-reply模式


 傳送請求-等待響應結果。在傳送方做了一個執行緒的等待,要等待結果的notify。


640?wx_fmt=png

在分散式訊息系統的構建過程中,基於業務的需求,我們在RocketMQ的訊息系統中新增了多項高階特性,包括多中心多活、灰度釋出、熔斷機制、訊息存活期、流量的權重、訊息去重、驚群效應問題的解決、背壓模式、訊息服務治理、MQTT訊息服務等。

 

基於RocketMQ新增的一些訊息高階特性


同城多活


DC級別的多活希望解決的問題是,不僅訊息不能丟,還要保證服務不能中斷。這裡有兩個層面的故障,一個是應用全部當機,那麼希望被其他IDC的應用能夠迅速來接管訊息,另外一個是訊息中介軟體當機,那麼希望生產者能夠切換到其他IDC的中介軟體進行傳送,並且這個中介軟體的訊息在其他IDC有備份,能夠進行消費。微眾已經通過IDC斷網演練檢驗同城多活能力。

640?wx_fmt=png

灰度釋出


灰度釋出希望解決的問題是,同一個消費組內不同的例項有監聽不一樣的topic時,能保證不同topic的訊息被正確的例項消費。


640?wx_fmt=jpeg

灰度釋出示意圖

 

熔斷機制


當希望訊息的堆積到一定程度時,可能是消費者出現了故障,我們希望能夠提醒生產者。

640?wx_fmt=jpeg

熔斷機制示意圖

 

流量權重(自動伸縮Q)


說到流量的權重,有一個問題是,Topic的Q值是在使用過程中手動設定的,當例項的數量超過Q的數量,那麼超過部分的例項是收不到訊息的。但是,如果你的例項數量小於Q的話,它們之間會由於負載均衡分Q。根據負載均衡演算法,分到的Q可能是不一致的。比如有的分到2個,有的分到3個。在這種叢集消費的情況下,就會出現處理的不對等。比如當大流量到來的時候,分到3個Q的那個例項可能會出現一些問題,比如掛掉了。


所以我們希望,不同的例項拿到的訊息量應該是對等的。所以,流量權重希望解決的問題是,隨著例項數的動態增加和減少,能夠動態調整consumeQueue的數量,不至於出現流量不均勻的情況。因此,我們做了一個自動伸縮Q的功能。預設Topic建成時,Q的數量是1,當啟動一個新的例項的時候,會自動擴充套件一個,停掉一個例項的時候會自動縮一個。從而達到Q個數量和例項的數量是一一對等的。這解決了例項和訊息量不對等的問題。

 

訊息去重


在負載均衡的一個很短時間內,當新上一個例項的時候,由於大家分到的Q都是相同的,當前一個分到Q的還在繼續拉訊息,下一個例項由於負載均衡很快做完,也分到Q,就會去拿這個Q的訊息,這個時候就會出現訊息的重複。此時,通常會通過Redis等快取方式進行去重,也可以在Broker上做一個簡單的處理,例如用互斥鎖,在競爭消費的短時間內,對其進行加鎖,搶到鎖的才能進行消費,同時佔有鎖的時間有限制,從而解決訊息去重的問題。

 

640?wx_fmt=jpeg

訊息服務去重原理圖

 

訊息的背壓消費模式

640?wx_fmt=png

背壓模式示意圖

 

在一些特殊場景下,需要對訊息引擎做一些加強,例如背壓模式。當訊息拉到本地的消費執行緒池時,會出現一個問題。當要做一些例如DB的寫的操作導致出現執行緒卡死,處理能力會下降,服務出現降級,但是訊息還在不停地往本地拉。


這個時候,我們希望達到一種效果,能夠根據後續服務的治理能力決定拉的訊息數量。當然RocketMQ的ProcessQ也能達到這個效果,但是還不夠精細化。因為在金融場景下,交易一旦出現不一致或者超時,會很麻煩。所以我們希望在實時的交易鏈路上去解決這個問題。於是我們做了一個類似Reactor框架的背壓處理,能夠根據處理能力實時拉取訊息。

 

訊息存活期


當對訊息的有效期有要求時,可以在消費訊息時對存活時間進行判斷,超時則丟棄。

 

記憶體模式


對於存活期非常短和對延時要求比較低的訊息,我們通過記憶體模式(不落盤)進行加速,降低延時。

 

驚群效應問題


因為負載均衡演算法在客戶端,客戶端的連線和斷開都會觸發消費組內的所有例項會收到notification做負載均衡。比較理想的情況是,一個例項的掉線不能影響到其他例項,當監聽的topic比較多時,會出現負載均衡慢的問題,因此我們希望負載均衡收斂到服務端來做,客戶端只需要關注topic,不需要關注consumeQueue。

 

目前,我們團隊已經參與到Apache RocketMQ的社群建設中,並對自用的訊息服務以社群分支的形式在維護,希望各行業更多的開發者可以一起參與進來,以打造適用範圍更廣、更好用的分散式訊息引擎。

 

作者介紹:陳廣勝,Apache RocketMQ資深Contributor。


最後,阿里妹為你介紹兩場不容錯過的開發者交流活動,有興趣的同學趕緊收藏起來~


Apache RocketMQ 開發者盛會


Apache RocketMQ 開發者沙龍上海站將在2019年1月12日13:00正式開啟,屆時將有多位行業專家帶來精彩分享。點選文末“閱讀原文”,瞭解詳情、免費報名哦。


本週三晚阿里技術直播:深入解讀 Dubbo


目前,Dubbo正在從一個微服務領域的高效能Java RPC框架演進到一個微服務框架。1月9日(週三)晚19:30-21:00,歡迎做客阿里技術直播間,共同深入瞭解全新的 Dubbo Ecosystem。


本次直播,我們將重點了解:什麼是Apache Dubbo Ecosystem?和Dubbo、Spring Cloud有哪些聯絡?如何幫助開發者解決調研和選型過程中遇到的難題,以及Dubbo Ecosystem未來的發展計劃等。


640?wx_fmt=jpeg


直播參與方式:

使用“釘釘”搜尋Dubbo開發者交流群號:21913618,加入永久釘釘群,既可到時觀看直播,也可與嘉賓、行業同仁交流互動


640?wx_fmt=gif

你可能還喜歡

點選下方圖片即可閱讀


640?wx_fmt=jpeg

深度:線下場景的客流數字化探索與應用


640?wx_fmt=jpeg

阿里2018成績單出爐;達摩院釋出十大科技趨勢;Fusion Design 正式開源 | 周博通


640?wx_fmt=jpeg

萬字長文揭祕:阿里如何實現海量資料實時分析?


640?wx_fmt=jpeg

關注「阿里技術」

把握前沿技術脈搏

相關文章