2017雙11交易系統TMF2.0技術揭祕,實現全鏈路管理

weixin_33924312發表於2017-12-22

摘要:
本文是《2017雙11交易系統TMF2.0技術揭祕》演講整理,主要講解了基於TMF2.0框架改造的交易平臺,通過業務管理域與執行域分離、業務與業務的隔離架構,大幅度提高了業務在可擴充套件性、研發效率以及可維護性問題,同時以更好的開放模式,讓業務方能自助進行無侵入的需求開發。

12月13-14日,由雲棲社群與阿里巴巴技術協會共同主辦的《2017阿里巴巴雙11技術十二講》順利結束,集中為大家分享了2017雙11背後的黑科技。本文是《2017雙11交易系統TMF2.0技術揭祕》演講整理,主要講解了基於TMF2.0框架改造的交易平臺,通過業務管理域與執行域分離、業務與業務的隔離架構,大幅度提高了業務在可擴充套件性、研發效率以及可維護性問題,同時以更好的開放模式,讓業務方能自助進行無侵入的需求開發。內容如下。

阿里巴巴資深技術專家 毗盧

毗盧,阿里巴巴資深技術專家,主導設計了TMF2.0框架,並基於該框架完成交易平臺架構升級改造,目前負責商品中心,專注電商領域業務建模與工程交付相結合的研究與平臺推廣。

交易平臺遇到的挑戰

在剛剛過去的2017雙11,交易峰值達到了32.5萬筆/秒,這給整個交易系統帶來了非常大的挑戰。一方面,系統需要支撐全集團幾十個事業部的所有交易類需求:要考慮如何能更快響應需求、加快釋出週期;如何能為新小業務提供快速支撐、降低准入門檻;是否足夠開放使得業務方能做到自助式擴充套件;新需求是否已經在其他事業部有可複用資產等問題。另一方面,整個電商體系涉及的應用高達7000+:要考慮需求的評估是否具有全鏈路視角;業務需求的技術評估是否分析全面、技術方案的影響範圍是否評估到位;業務的全鏈路穩定性保障、呼叫鏈路監控、強弱依賴等問題。此外面對每天幾百個業務需求,500+個獨立的釋出變更:要考慮各業務方的需求釋出是否會相互產生影響;需求程式碼是否對平臺有侵入、導致平臺腐化;高頻率的需求釋出下如何管控質量;能否按業務維度進行業務監控、故障分析等等。

TMF2.0解決的關鍵問題

面對這些挑戰,TMF2.0框架需要六大關鍵問題。

  • 業務視覺化:平臺能力、業務規則決定是否對外透出;
  • 需求結構化支援:基於透出的業務能力、已有的業務規則完成需求結構化分解降低溝通成本;
  • 業務配置化:這是視覺化的前提,要在需求明確的情況下線上配置業務、快速釋出上線;
  • 業務測試一體化:根據修改的程式碼進行自動化用例篩選、自動化測試;
  • 業務監控:以精細化的業務維度進行監控,而不僅僅侷限於交易大盤;
  • 故障排查:當業務故障時快速拿到故障快照、還原故障現場以及迅速定位問題原因。

針對以上六大關鍵問題,TMF2.0的關鍵設計點有以下三個層面。

首先,需要實現業務/平臺分離外掛化架構。平臺提供外掛包序號產生器制,實現業務方外掛包在執行期的註冊。業務程式碼只允許存在於外掛包中,與平臺程式碼嚴格分離。業務包的程式碼配置庫也與平臺的程式碼庫分離,通過二方包的方式,提供給容器載入。

其次,要統一業務身份。平臺需要能有按“業務身份”進行業務與業務之間邏輯隔離的能力,而不是傳統SPI架構不區分業務身份,簡單過濾的方式。如何設計這個業務身份,也成為業務與業務之間隔離架構的關鍵。

另外,要注重管理域與執行域分離。業務邏輯不能依靠執行期動態計算,要能在靜態期進行定義並視覺化呈現。業務定義中出現的規則疊加衝突,也在靜態器進行衝突決策。在執行期,嚴格按照靜態器定義的業務規則、衝突決策策略執行。

下文將針對這三塊的內容分別展開來詳細介紹。

業務定製包與平臺分離的架構

如上所示的業務定製包與平臺分離架構可以分為四個層次。最底層是交易規範層,包括一些交易模型、交易領域的劃分、業務領域的劃分、以及交易啟動環境下的配置項。基於這個理論模型,就可以進行一些定義及規範工作,比如介面定義、流程規範、模型規範等,而且其中的很多內容都可以在不同的領域進行復用。

上面一層是解決方案層。大家都知道阿里巴巴目前正在走國際化的戰略,所以面對不同的市場會構建不同的解決方案,不同的解決方案中也就有自己不同的業務玩法、業務邏輯。所以要將不同的市場解決方案和他們自身的流程、規則結合起來。但是這一過程中會發現,不同的市場解決方案會有很多可以複用的地方,比如營銷模式。所以形成的可複用基礎實現就可以在不同的解決方案中得到複用,所那麼在面對不同的市場時就不用考慮可複用基礎實現的內容,只需要關注市場相關的業務就可以了。

往上一層是業務定製層。即使是在一個市場內,也會有各種細分的定製玩法,這些不同的細分點就會有各自不同的業務邏輯,這就是制定業務定製層的原因。團隊會根據底層的需求點來進行一些業務定製包的組裝,就可以實現不同的業務邏輯和玩法了。

在這樣一個複雜的分離架構中,最重要的是要將不同層次間的職責劃分清晰,整個程式碼都嚴格地、有意識地進行分離。所以在最後的部署過程中,首先要完成底層業務的複用,然後形成不同市場的解決方案,再在解決方案下對不同的業務實現差異化的點。

業務身份定義標準化

上面所講的是業務和平臺的分離,在業務和平臺分離之後就要進行業務和業務之間的隔離,即統一的業務身份,類似於身份證號碼,在整個交易鏈路上必須是唯一的。業務身份需要通過人、貨、場三個維度進行抽象,比如市場型別、垂直市場、渠道來源等等,確定了這個唯一的業務身份後就可以將業務流程和業務規則進行關聯。

基於業務識別,團隊也提供了一個基於UIL的業務身份識別方案,總體設計基於標準模型來抽象,自定義語法,統一管理模型。事實上,通過樣品模型、買家模型、賣家模型、類目模型這四個維度,99%的商品都可以有效地進行標識。業務身份確定後,就可以按照業務身份維度,對業務配置、部署進行統一管理,在這其中要注意配置隔離性、熱部署、配置回滾、配置確定性等核心要素。

業務管理域與執行域分離的框架

業務身份確定後就要進行業務定義,這其中就涉及管理域和執行域分離的問題。管理域就是指對業務生命週期、業務身份、業務物件進行定義,包括業務流程、業務管理等。這些操作完成之後就會將配置檔案下發到,執行域上的各種平臺就會自動解析配置域所下發的配置檔案,然後將配置檔案解析成業務命令來執行。

在上面所講的業務域中,一個核心的問題就是如何定義業務:核心三要素是業務身份、業務疊加關係、衝突決策,即基於業務協議標準定義業務,執行單元按協議執行業務邏輯。

在業務疊加關係中,業務的複雜度就在於業務規則在不同維度下產生的衝突。業務的複雜度可以分為兩個維度,一個是橫向維度,一個是垂直維度。

垂直維度,也可稱之為“行業”。往往一個特定的“業務物件”(如商品),在靜態期就能確認其具體歸屬於哪個行業。行業與行業之間的業務規則是不會有疊加的。比如,付款超時時間,各可以都設定為1天超時。但“天貓汽車”把超時時間改了,一定不會聯動改其他業務的超時設定。橫向維度,也稱為產品維度,特點有:產品是可以被多個垂直業務所使用的、一個垂直業務是可以使用多個產品的、產品是否生效是需要結合業務會話的。比如,“電子憑證”是否生效,要看使用者是否選擇了“電子憑證”的交付方式。

通過業務複雜度的分析,可以得出一個結論是:一次業務會話完整的規則=1個垂直業務規則集合+ N個水平業務規則集。所以在做業務定義和管理的時候,具體就是在管某一個垂直業務是和哪些橫向業務在疊加。在疊加之後產生的業務衝突又是怎麼解決的?要基於這一點進行業務管理。這是比較關鍵的一點。

TMF 2.0的關鍵模型介紹

基於以上的業務域介紹,下面詳細闡述一下TMF 2.0的關鍵模型,主要包括業務配置主線和業務執行主線。

在業務配置主線中,由專案的業務PD來看一下當前業務涉及到哪些業務域,以及這些業務域下面有哪些功能和產品可以去使用,哪些業務點是可以去擴充套件的。這其中就需要能力域模型的支撐,通過這個模型所透出的結構化資料,來研究平臺中每個域具備的能力、每個能力具有的可變點,從而有針對性地進行設定。在配置模型裡,通過關鍵的檢視模板,進行模板透出,然後儲存、下發配置資料到業務執行主線。業務配置主線和業務執行主線是相互動的。

基於TMF 2.0關鍵模型,整個交易平臺實現了業務定義可視、可管、可配。業務定義視覺化包括系統能力視覺化、業務流程視覺化、業務規則視覺化、產品疊加視覺化等;業務可配置,所見即所得的業務規則可配置能力,凡是基於TMF2標準構建的系統均立刻可獲取業務可配置能力,不需做額外的開發;配置版本化,針對業務配置有完善的版本化管理機制,配置推送可實現按版本快速生效或者回退;業務多租戶管理,不同的業務系統之間可以通過租戶完全隔離的。不同的租戶有自己的資料空間,以及配置推送策略。

在實際應用中,基於TMF2.0交易平臺改造效果具體如下:

  • 業務需求平均開發週期縮短至12天。比如汽車4S服務中,在老系統上做了一個月(未完成),新系統7天完成;五道口業務中,在老系統中評估工作量兩個月,新系統12個工作日完成;餓了麼業務中,老系統評估要兩週,基於新系統2天完成。
  • 平臺與業務解耦。目前已完成的業務,其業務定製均只存在於業務包;在平臺未改動情況下,業務方的釋出更加靈活(有多次單業務釋出,不需要其他業務方進行迴歸的案例)。
  • 業務資產庫。積累形成了50+業務資產庫,新業務可快速進行快速複製、調整併發布。


相關文章