2021ArchSummit全球架構師峰會上,大家在聊些什麼

JasonCeng發表於2021-05-13

大會PPT公開下載連結:https://ppt.infoq.cn/list/assh2021

大會主要情況介紹

2021 ArchSummit全球架構師峰會是該大會正式成立的第十年,是極客邦科技旗下InfoQ中國團隊推出的重點面向高階技術管理者、架構師的技術會議。

會議聚焦業界強大的技術成果,秉承“實踐第一、案例為主”的原則,展示先進技術在行業中的典型實踐,以及技術在企業轉型、發展中的推動作用。旨在幫助技術管理者、CTO、架構師做好技術選型、技術團隊組建與管理,並確立技術對於產品和業務的關鍵作用。

作為剛剛參加工作兩年的IT從業者,我從這次大會上學到了些什麼呢?下面一起聊一聊。

主題演講

本次大會的主題演講可以算得上是業界技術發展方向的一次風向標。來自阿里巴巴的數字供應鏈資深技術專家黃浩分享了題為《二十年觀察:分散式架構的演進和方向性發展》主題演進,從該演講可以感受到,“分層架構”是整個架構演進之路中的一個核心且不變的東西,不管是當下的雲原生時代,還是未來的雲邊一體協作計算模式,這是大道至簡的一個核心。

其次,來自順豐科技的架構委員會負責人劉潭仁老師做了題為《順豐科技架構升級之路》的主題演進,這讓我意識到不管是哪個行業,技術的實踐與落地離不開組織架構的支撐,組織架構也是“架構”中一個十分重要的研究課題。

最後,來自阿里巴巴的吳翰清(道哥)做了題為《我對計算的理解》主題演講,道哥的分享沒有使用PPT,但他思路清晰地從計算機發展的歷史、數字化轉型升級的發展以及計算的本質是對現實世界的模擬闡述了他所理解的計算,他說:“淘寶是一種計算,百度是一種計算,AI 也只是一種計算。計算要解決的核心問題是模擬和預測的問題,電腦科學是通過機器來解決模擬和預測的問題。”且在最後,他表達了對計算的未來的展望,他認為計算的未來是創造,這也將是一件顛覆性的工作。

對本次大會做一個全面性的概述吧,本次大會涵蓋雲原生、容器化、微服務架構;彈性架構實踐;大資料和AI結合的系統架構;DDD(領域驅動設計)落地實踐以及數字化轉型等多個議題,通過議題可以感受到雲原生、大資料、人工智慧對軟體領域的深刻變革和影響。以上領域是來自網際網路企業的最佳實踐分享,對於傳統行業的技術發展同樣有著巨大的借鑑意義,特別是在國產化轉型的時代背景下,下主機工程、研發自主可控技術的目標驅動下,雲原生、容器化、微服務等技術都亟待我們去深入學習並應用到銀行的技術體系中,相容幷蓄,取長補短是我們接下來需要做的工作。

參加的課程及個人思考及收穫

本次大會,我結合工作需要聆聽了以下方向的議題,分別是微服務架構、雲原生容器化、彈性計算架構實踐、大資料和AI結合的系統架構。

微服務架構、雲原生容器化

《面向生產環境的中介軟體容器化實踐》

演講者:張曉龍博士 網易數帆 基礎架構總監
張曉龍博士帶來的演進從背景、需求與平臺架構、解決共性問題的最佳實際以及他們後續的工作計劃幾個方面進行了分享。

開源基礎中介軟體如MySQL/Redis/Kafka等已發展成熟多年,目前已成為業界技術標準,但這些中介軟體誕生之初並不是面向雲原生進行設計的,這就導致了一些運維方面的挑戰,例如運維複雜性高、運維效率低、穩定性保障不足、彈效能力不足等,而云化正好可以提升以上方面的難題,目前在業界,中介軟體雲服務化已逐漸成為趨勢。

網易數帆第一代雲基礎中介軟體平臺構建在網易雲基礎設施上以獲得彈性,採用IaaS租戶隔離策略,抽象出公共服務並實現能力複用,以上策略使得中介軟體運維水平、效率、彈性、SLA保障等能力得到顯著提升。

同時,從該演講可以瞭解到,目前業界雲化的事實標準是以容器技術Docker、K8S為代表,作為基礎設施在業界得到廣泛落地。容器技術Docker、K8S具有以下技術優勢。

技術 Docker Kubernetes(K8S)
技術優勢 具備弱隔離特性,有助於資源共享並提高利用率 高效管理容器化應用
輕量級虛擬化消除效能損耗,業務執行更平穩 強高可用/故障自愈能力
基於映象實現標準化封裝應用,實現高效交付 彈性易擴充套件,面向大規模生產環境設計
具有靈活、強大的彈性資源排程/編排能力 開源社群發展快/生態強
是實現雲原生技術棧的核心與基礎底座 基礎設施鬆耦合、高度自動化

《虎牙雲原生容器化實踐:從服務化ES,MQ到異地多活》

演講者:張波 虎牙直播 基礎保障部 中介軟體負責人

張波老師從一箇中介軟體的故障例項引入,介紹了虎牙直播在中介軟體領域遇到的挑戰和思考,以及他們在中介軟體容器化建設過程中踩過的那些坑。

整個分享聽下來,我個人覺得虎牙直播在中介軟體領域遇到的最大挑戰還是資源利用率偏低這個難題,整個生產叢集中,低載例項在70%左右;其次是問題定位處理能力低,定位力度粗,缺乏隔離恢復手段。

通過混布與隔離、限流/熔斷降級、全鏈路訊息軌跡追蹤等技術手段,虎牙直播解決了低載、問題定位處理能力低等問題。

混布與隔離:虎牙直播的中介軟體叢集與業務線上叢集是同一套,但在叢集內部通過中介軟體Topic容量動態規劃Brocker數量。當請求量大時,負載較高提供獨立例項;當請求量小時,採用邏輯隔離的方式。

限流/熔斷降級:通過微服務提供訊息服務,根據執行緒數/TPS/QPS進行限流,採用削峰填谷的方式,保障服務的質量。

全鏈路訊息軌跡追蹤:對訊息從生產方發出到消費方處理的全鏈路追蹤,把整個過程中各個相關節點的時間、地點等資料匯聚成完整鏈路資訊。

《雲原生微服務治理架構深度解讀和實踐》

演講者:童子龍 騰訊雲 中介軟體高階工程師

童老師從雲原生微服務架構的思考與實踐,以及對騰訊雲微服務治理框架的深度解讀介紹了他們所做的一些工作以及後續的一些計劃。

對於雲原生微服務架構的理解,童老師認為應該是容器化部署的;且是面向配置的:一個映象,多個環境配置;同時應當表現出高SLA:低開銷、高效能、高可用性;且是可觀測的:叢集級別的日誌、metric和鏈路追蹤;最後在安全性方面:訪問授信、API Gateway、端到端加速也是必要的。

在本分享中,他也提出了微服務治理的趨勢:

(1) 多語言、多協議適配

(2) 核心治理能力標準化、可擴充套件

(3) 民主化鬆耦合,無廠商依賴

(4) 治理能力下沉,全面相容開源

(5) Clound native,run anywhere

正是以上趨勢,以及種種原因,使得分層設計十分重要,特別是當前微服務框架協議不統一;加之對擴充套件性、易用性考量;以及微服務中介軟體多樣性、平臺多樣性。同時,上層治理平臺能力邊界各異,平臺按照各自的需求,組合底層治理元件能力,達到以instrumentation的方式快速接入的效果。

彈性計算架構實踐

《基於雲原生的彈性架構設計與生態體系建設實踐》

演講者:趙嵐玉(趙宇) 菜鳥網路 技術專家

趙老師的演講從IDC到混合雲、公有云,以及對雲彈性的思考與落地實踐進行了分享。

對於業務出海以及大促擴容的場景,菜鳥網路通過國內IDC以及公有云VPC的方式,高效提升了交付能力,攻克了中介軟體在混合雲架構下的適配與安全問題。

且依靠混合雲架構,在大促資源儲備方面,由過去的10個月降低至40天,資源交付能力提升10倍+。通過大促的彈性實踐,推動了菜鳥網路的日常彈性,主要依靠的是自適應策略來達到這種效果,通過日常彈性,使得應用日均CPU利用率提升70%。

在公有云的架構實踐方面,菜鳥網路通過上雲實現了以下收益:

(1) 精細化管控成本

(2) 核心雲產品具備多可用區保障

(3) DevOps研發模式升級

(4) 雲上元件豐富,可節省業務創新的技術成本

對比IDC和雲,我們可以看到其各自的痛點。雖然IDC的模式下,交付週期較長,但其顯著的收益是成本按需申請,不易發生失控。但同時我們也要看到,上雲可以解決資源彈性,實現快速升降配的目的。

《阿里DChain中臺的彈性架構設計與深度實踐》

演講者:馮微峰(諸葛瑾) 阿里巴巴 資深技術專家

馮老師是供應鏈技術領域的專家,他所做的演講從阿里供應鏈中臺介紹,到中臺開放彈性架構設計,再到彈性架構下穩定性設計與深度實踐進行了分享。

個人最大的感受是大企業在發展到一定階段,會面臨一些前所未見的量級挑戰,正如阿里巴巴集團供應鏈領域,目前資產規模是千億,涵蓋15個大域,26個BU(事業群),如何做到行業快速接入以及資源的彈性伸縮是一個巨大的挑戰。

對於實現“行業快速接入”這個課題,阿里提出了CLED(Coniguration+LowCode+Extension+Development)的設計理念。個人認為可配置化是十分重要且基礎的一個理念,這個設計原則可以幫助我們實現一套程式碼,多平臺執行,並達到易擴充套件的目標。

對於“彈性伸縮”這個課題,阿里提出了基礎設施即程式碼(IaC)的概念,IaC意味著可彈性和可替換。

圍繞這兩個設計理念,阿里供應鏈實現了近百個行業快速接入,40%的行業需求配置化(Configuration)實現,40%的行業需求(LowCode+Extension)實現,20%的行業需求(Development)實現,行業需求平均交付時長從14天縮短到5.8天。

整個分享下來,其實核心還是可配置化的實現,以及藉助雲原生利器Kubernetes實現了整個中臺的彈性伸縮。這也是我行可以對標的一個方向。

大資料和AI結合的系統架構

《大融合時代:訊息、流、儲存三位一體》

演講者:郭斯傑 StreamNative聯合創始人兼CEO

郭老師演講的主題圍繞Apache Pulsar展開,在Pulsar之前,訊息佇列中介軟體框架以Kafka、RocketMQ、RabbitMQ、ActiveMQ為主,但這些訊息佇列都部署面向雲原生進行設計的。

而在雲原生時代,他認為一個好的架構應該是儲存和計算分離、節點對等、獨立擴充套件、靈活擴容、快速容錯的。在雲原生架構下,Pulsar內部自實現了企業級流儲存層BookKeeper,該儲存層有以下特點:低延時、高吞吐、持久化、強一致、高可用、I/O隔離。

Pulsar的企業級特性是:適應大叢集、多租戶的特點,可以保證叢集內中介軟體版本的一致性;同時,它原生支援跨地域複製的特性也十分適合企業使用者跨地域容災的需求。

前面提到的傳統訊息佇列要麼以佇列模式為主,要麼以流模式為主,而Pulsar是以佇列+流一體融合發展的。正是因為這樣的設計模式,才使得Pulsar即適合實時場景,也適合批量場景,其場景相容性得到很大的提升。

目前Apache Pulsar在騰訊、華為雲、虎牙直播、平安證券都有廣泛的落地應用,後續在資料系統相關建設時可以考慮引入,提升企業自身的技術領先水平。同時也可以感受到,Pulsar有取代Kafka成為雲原生時代訊息佇列的野心。

《攜程萬億級KV儲存治理演進之路》

演講者:李劍 攜程網 技術保障中心 技術專家

李老師在KV儲存領域有豐富的研發經驗,他的演講分享了攜程KV儲存發展歷程及架構實踐,特別是在Redis治理演進過程中的相關實踐和思考。

攜程從2013年開始引入Redis和Memcached,在2017年對Redis做了容器化,2018年至2019年做了Redis二次排程與水平拆分方面的工作,從2020年初開始主要是對Redis水平擴縮容和持久化KV落地做了大量工作。

攜程所遇到的問題其實總結起來也是對宿主機資源利用率的問題,促使他們做了以上方面的演進。

特別是在持久化KV方面,為了實現資料持久化、節約記憶體成本,攜程做了持久化KV的技術選型,他們選型的標準是:

(1) 業界主流

(2) 有成熟的中介軟體

(3) 運維治理配套完善

(4) 效能快,能方便10X擴充套件

(5) 可以二次開發,獨立演進

目前國內的網際網路企業的KV儲存產品主要有:

公司 KV儲存產品
美團 Cellar
餓了麼 Tidis
360 Pika
騰訊 Tendis

最終攜程選擇了kvrocks作為他們的持久化KV,首先該產品是一個單體應用,無私貨;其次它對Redis命令語義相容度最高;另外它的效能與Redis幾乎無差異。

目前區塊鏈領域普遍採用KV資料庫進行世界狀態儲存,且在寫效能方面遇到了較大的瓶頸,攜程的持久化KV演進之路可以給區塊鏈儲存提供大方向上的指引,同時,在架構層面上可以考慮快取層的優秀作用,進一步提高區塊鏈在讀寫方面的效能。

《存算分離架構下的資料湖架構》

演講者:程力 騰訊雲 高階工程師

程老師在儲存領域有深厚的積累,他個人是Apache Ozone PMC以及Apache Hadoop Commiter。本次演講他從雲原生生態下的存算分離、資料湖三層加速以及大資料和AI下的資料湖架構進行了分享。

資料儲存經歷了以下階段的發展:

(1) 存算一體:孤島

(2) 存算分離:儲存、計算解耦

(3) 資料湖:儲存統一

(4) 雲原生:計算統一

促使整個儲存架構不斷升級的原因除了業務的發展外,本地盤HDFS壓力大、運維成本高,業務間資料共享難,計算節點排程效率低等也是重要的原因。目前,騰訊雲實現了以物件儲存為底座的存算分離架構。

同時,騰訊雲資料湖的三層加速也十分值得借鑑和學習。在儲存端,騰訊雲通過物件儲存COS加速器實現資料加速;在資料端,通過後設資料加速達到該層加速的目標;在計算端,通過湖倉快取加速來達到目標,這一層命名為GooseFS。

特別值得一提的是,在後設資料加速層,後設資料被快取到計算節點Metadata Cache中,並通過RocksDB進行持久化。這個設計其實可以為我們所借鑑。

在區塊鏈的世界狀態資料儲存中,我們可以實現各個節點的“Metadata Cache”,再對相關Cache進行持久化儲存到RocksDB。

後續工作思考

區塊鏈領域的雲原生容器化工作展望

本次會議的主旨圍繞的領域是雲原生與容器化,而Kubernetes、Docker作為當下整個業界的事實標準,幾乎在每一場報告中都能聽聞其聲影,網際網路行業也針對自身的業務場景,以及對降本增效的追求提出了許多有挑戰性的課題與方案,他們當中不乏有對以上開源框架進行改造並適配到自身架構中的。

區塊鏈作為一項炙手可熱的技術,在雲原生時代也可以順技術潮流而持續發展。Hyperledger fabric整個技術架構還是較為符合雲原生架構的,特別是在節點容器化、可配置化等方面做了大量的工作,後續可以結合本次大會的技術風向,深入探索k8s在區塊鏈領域是否能有更為深入的應用,以提升整個區塊鏈運維能力為目標,甚至達到業界所達到的AIOps的成效。

區塊鏈儲存效率提升方面的工作展望

本次會議有相關大資料架構領域的報告,大資料技術在當下歷史發展的浪潮中也有廣泛的應用,資料作為全新的生產要素,其重要程度不言而喻。

在區塊鏈領域,對資料的儲存、加密其實也是圍繞資料這一生產要素展開了一系列的工作。但目前的區塊鏈在儲存效率方面還有較大的提升空間,除了尋求從區塊鏈核心級的優化外,從本次大會中我得到了架構方面的啟發。

特別是在KV持久化和Cache的架構應用工程實踐中,應該能有效提升區塊鏈儲存效率。

區塊鏈在彈性計算方面的工作展望

本次會議中,網際網路企業所分享的他們在彈性計算方面的工作也十分值得借鑑,這是技術對於企業IT成本方面的貢獻,彈性計算可以提升我們對資源的利用和管控,實現對IT成本精細化運營。

從另一個維度來看,彈性計算可以提升整個系統的執行穩定性,使得系統在面對流量洪峰等場景時能夠快速進行擴容,這是提升系統SLA的一個重要維度。

區塊鏈系統在未來走向大規模應用過程中,運維能力是十分重要的一項能力,而彈性計算則有望成為區塊鏈系統在執行時的重要保障。

對該會議的評價

2021 ArchSummit全球架構師峰會總體來說質量較高,每一位分享嘉賓都是業界技術能力很強的老師,他們所分享的課題都是他們在企業實踐中總結出來的寶貴經驗,且也共同代表了整個業界技術發展的風向標,有較高的借鑑意義。

但同時對於每一場分享我們也要抱著懷疑的態度,取長補短,而不是全盤接受,找到適合企業自身技術發展最合適的路徑才是我們參會的初衷,以上。

更多關於大資料、分散式、儲存、區塊鏈、Linux相關文章請關注微信公眾號:asympTech漸進線實驗室

Github、知乎、部落格園、CSDN、簡書全網唯一id:JasonCeng

相關文章