雲棲釋出|企業級網際網路架構全新升級 ,助力數字創新

阿里巴巴雲原生發表於2021-10-26
簡介:雲原生產品家族全面升級,讓業務技術團隊有了更多選擇,通過簡單、豐富、開放和低成本的 PaaS 服務,幫助企業客戶更簡單、更高效的進行在雲上創新,搭建更符合業務需要和團隊情況的技術體系。

作者|白璵

在 2021 杭州·雲棲大會現場,阿里雲智慧雲原生應用平臺產品負責人李國強以《企業網際網路架構轉型之道 - 阿里雲中介軟體升級釋出》為主題,全面解讀阿里云云原生產品創新實踐。過去一年中,為應對愈發激烈的行業競爭,重構應用架構已成為大勢所趨,據權威機構資料顯示,80% 以上的使用者已使用或計劃使用微服務,超過 68% 的機構在生產環境中使用容器。85% 以上使用者使用分散式追蹤,監控工具,日誌。這些變化都凸顯出企業對於應用架構雲原生化、部署運維雲原生化、穩定性升級的強烈訴求。

 title=

阿里巴巴集團作為雲原生受益者,通過雲原生充分獲得雲端計算技術紅利,並實現全球最大規模的雲原生實踐,所有業務 100% 跑在公共雲上,應用 100% 雲原生化。基於容器軟硬一體優化,線上業務部署百萬容器規模,帶來 CPU 資源利用率提升 30%、萬筆交易成本下降 80%、研發運維效率提升 20% 的技術價值。也是基於此,阿里巴巴將這些最佳實踐、解決方案分享給社會,幫助稅務、人社、銀行、保險、石油石化、零售快消、汽車製造、網際網路平臺等眾多行業挖掘更多社會價值。經過多年技術沉澱,阿里雲提供超過 300 款雲產品、近千個解決方案。在這其中,訊息佇列 MQ、應用實時監控服務 ARMS、企業級分散式應用服務 EDAS 等已經成為不少企業在分散式網際網路架構中必不可少的元件。而此次雲棲大會也首次對外曝光了這些產品的全新特性。

 title=

RocketMQ5.0 重磅升級

訊息佇列作為當代應用的通訊基礎設施,微服務架構應用的核心依賴,通過非同步解耦能力讓使用者更高效地構建分散式、高效能、彈性健壯的應用程式。就資料與價值角度而言,訊息佇列的價值不斷深化。訊息佇列中流動的業務核心資料涉及整合傳輸、分析計算和處理等不同環節與場景。伴隨著不斷演進,我們可以預見訊息佇列勢必在資料通道、事件整合驅動、分析計算等場景不斷產生新價值,創造新的“化學反應”。

 title=

此次,阿里雲 RocketMQ 釋出 5.0 版本全面升級為一站式“訊息、事件、流”融合處理平臺,並具備以下兩大亮點:

(1)訊息核心場景擴充套件:覆蓋事件驅動與訊息流式處理等眾多場景;

(2)一站式融合處理技術架構迭代:實現一份訊息儲存支援流式計算、非同步投遞、整合驅動等多種場。

除去兩大亮點的同時,RocketMQ5.0 帶來全新三大功能:

(1)RocketMQ 基礎架構全新升級

  • 輕量版 SDK 的開放和全鏈路可觀測系統的提升
  • 訊息級負載均衡
  • 多網路訪問支援
  • 海量分級儲存

(2)在 Streaming 流式處理場景推出輕量級訊息 ETL 功能

  • 輕量無依賴
  • 開發門檻低
  • Serverless 彈性

(3)EDA 雲上最佳實踐——事件中心 EventBridge

  • 統一標準化的事件整合生態
  • 全球事件互通網路
  • Serverless 低程式碼開發

微服務產品家族再升級

微服務作為如今應用網際網路架構重要代表,隨著微服務與容器不斷融合,可以看到企業對於微服務應用架構與業務要求不斷明晰。架構方面,如 Spring Cloud、Dubbo 基於 Java 的微服務體系,以及隨著多元趨勢出現而逐漸興起的 Service Mesh 技術體系成為主流。需求方面,業務開發設計面向微服務、軟體基礎架構原生容器化、應用生產運維升級鳥瞰式成為核心訴求。阿里雲通過是微服務引擎 MSE、服務網路 ASM 去完美支撐這兩類不同微服務體系。

 title=

虛擬化時期的微服務架構下,業務通常採用流量閘道器 + 微服務閘道器的兩層架構,流量閘道器負責南北向流量排程和安全防護,微服務閘道器負責東西向流量排程和服務治理,而在容器和 Kubernetes 主導的雲原生時代,Ingress 成為 Kubernetes 生態的閘道器標準,賦予了閘道器新的使命,使得流量閘道器 + 微服務閘道器合二為一成為可能。

此次,阿里雲 MSE 釋出的雲原生閘道器在能力不打折的情況下,將兩層閘道器變為一層,不僅可以節省 50% 的資源成本,還可以降低運維及使用成本。MSE 雲原生閘道器依託於 Envoy 和 Istio 進行構建,實現了統一的控制面管控,並直連後端服務,支援了 Dubbo3.0、Nacos,打通阿里雲容器服務 ACK,自動同步服務註冊資訊。

MSE 雲原生閘道器早已在阿里巴巴內部經歷千錘百煉。目前已經在支付寶、釘釘、淘寶、天貓、優酷、飛豬、口碑等阿里各業務系統中使用,並經過 2020 雙 11 海量請求的考驗,大促日可輕鬆承載每秒數 10 萬筆請求,日請求量達到百億級別。

作為業內首個全託管 Istio 相容的服務網格產品,阿里雲服務網格(簡稱 ASM)作為統一管理微服務應用流量、相容Istio的託管式平臺,專注打造全託管、安全、穩定、易用的服務網格。支援跨地域多叢集、多雲混合雲服務的統一治理,讓無處不在的應用服務輕鬆跨多種異構計算基礎設施進行相互通訊。今日更是對外發布 ASM Pro 專業版,覆蓋更多應用場景,主要包括:

  • 支援 Dubbo 等微服務框架與擴充套件協議:通過提供更多場景化能力滿足客戶灰度釋出、金絲雀釋出、服務流量無損下線、以及全鏈路灰度等不同訴求。
  • 全面融合多種服務註冊中心:充分融合 Nacos 服務註冊中心的高可用能力、跨註冊中心的多語言服務互通、以及高效能、大規模場景支援。
  • 雲邊一體的統一服務網格能力:支援跨地域多叢集、多雲混合雲上的服務的統一治理、支援 ACK Edge 邊緣叢集,探索邊緣計算中服務網格的場景。
  • 優化現有應用進行現代化改造:統一支援容器、虛擬機器等多種異構計算基礎設施的混合部署, 助力虛擬機器應用的遷移;增強 OPA 策略動態執行能力,無程式碼改造實現零信任安全,簡化管理多種型別的計算基礎設施上的應用。
  • 全棧優化:通過作業系統和軟硬一體方式降低服務通訊時延和加密開銷,提升 TLS 加解密的效率及資料面的效能。 

通過流量控制、網格觀測、服務間通訊安全等功能,服務網格 ASM 全方位簡化服務治理,為執行在異構計算基礎設施上的服務提供統一管理能力,適用於無處不在的 Kubernetes 叢集、Serverless Kubernetes 叢集、ECS 虛擬機器以及自建叢集。

最後,微服務應用在開發過程中,需要一個全站式平臺覆蓋應用架構設計、開發、測試、上線、運維整個體系。一站式雲原生應用研發支撐對於使用者的提效具備著非凡的意義。因此,雲原生應用設計&開發平臺 ADD 應運而生,幫助企業快速進行原生開發,以應用視角全生命週期管理雲原生應用,並具備以下特性:

一、應用開發&架構設計:實現支援應用架構圖的拖拉拽式設計,提供預置及企業自定義應用架構模板。

二、雲原生資產商店:為企業提高開箱即用的中介軟體服務,並沉澱企業的公共業務元件、公共技術中介軟體,實現企業軟體資產的標準化、產品化、分享和複用。

與此同時,企業級分散式應用服務 EDAS v4.0,重新構建使用者應用釋出與上線的整個流程,實現鳥瞰式運維以及雙模治理,助力應用運維現代化,加速線上業務雲原生化。

ARMS 3.0 - 企業可觀測體系 All in one

作為企業技術架構中的重要組成部分,不同社群、機構對於可觀測領域的趨勢觀點愈發收斂一致:

  • 全棧一體化:當一個請求進到業務系統,從前端到應用層到固定資源上,企業如何把整個鏈路串聯起,一體化的將縱向鏈路與橫向資料打通,成為考驗運維團隊的關鍵能力。
  • 雲原生可觀測標準化:當可觀測開源領域 Grafana、Prometheus、OpenTelemetry成為事實標準,企業搭建雲原生可觀測體系更加高效、有跡可循。
  • AIOps:隨著每個企業技術不斷擴張,其擁有的運維資料規模與維度不斷增加,包括海量指標、logging 以及 tracing資料。AI 在這過程中發揮巨大作用,更快速、更高效的發現、解決異常及問題。

 title=

為了滿足以上趨勢與需求,阿里雲釋出 ARMS 3.0,幫助企業實現可觀測體系 All in one,實現統一接入、統一指標、統一鏈路、統一計量、統一皮膚、統一告警。

  • 支援 50+ 技術元件,從接入體驗、業務應用到基礎設施層縱向全鏈路打通;
  • Metric,Logging,Tracing 橫向打通,加速問題診斷;
  • 全面支援 Prometheus、Grafana、OpenTelemetry 雲原生可觀測三大開源標準;
  • 支援接入 10+ 監控告警系統接入,實現離散告警訊息的統一管理,同時結合演算法與阿里經驗,提供智慧降噪和根因分析能力。

值得一提是,阿里雲憑藉 ARMS 成為國內唯一入選《2021 年 Gartner APM 魔力象限》的雲廠商,產品能力和戰略願景獲得 Gartner 分析師高度認可。

高可用

高可用家族中的應用高可用服務 AHAS 也進行了一次重大的產品升級,應用高可用服務(Application High Availability Service)專注於提高應用及業務的高可用能力,主要提供流量防護、故障演練、多活容災三大核心能力。此次升級各模組都在為使用者業務的穩定性和韌性方面有了很大的產品提升。

首先在流量防護方面,創新性的提供叢集防護功能,幫助客戶解決業務單機流量不均、叢集小流量等典型叢集流控問題。同時閘道器防護場景下,目前已經支援基於 C/C++ 原生版本的 nginx 外掛方案,穩定支援 Sentinel 核心流控及 API 歸組能力的同時,效能損耗大大降低,吞吐量損耗 5% 以內,CPU 佔用在 0.8 核以內。除此之外,監控告警能力和防護場景化方面都從業務場景維度和易用性維度有了較大的提升與優化。

故障演練(Chaos)是雲原生混沌工程平臺,提供了大規模、低成本、影響可控、形式多樣化的故障演練服務。Chaos 提供一站式架構分析、故障巡檢、故障注入、系統穩態度量等功能,幫助使用者增強分散式系統的容錯性和可恢復性,幫助系統平穩上雲。此次故障演練平臺也從演練場景、演練形式、易用性和開源相容等多方面進行了全面的升級。

  • 演練場景上,支援 Windows 型別的演練節點;支援預檢、斷網、恢復、覆盤一站式的容災斷網演練;微服務演練也升級至 2.0,支援服務級別的強弱依賴自動化驗證。
  • 演練形式方面,此次重磅釋出視覺化演練,支援基於業務架構拓撲一鍵發起演練。
  • 開源相容性方面,支援社群版線上託管至企業版,且支援一鍵升級至企業版。

多活容災(MSHA)方案由業務異地多活容災解決方案全面升級至業務多活容災解決方案,更相容、更穩定、更簡單。

  • 相容更豐富的容災架構與業務元件。

新增同城雙活/多活容災架構、異地雙活容災架構和異地應用雙活容災架構。新增對 MQTT、ScheduleX、K8S、PolarDB 等元件模組的多活容災支援。

  • 核心容災能力加固,穩定性提升 50% 以上。

通過對接入層、服務層、訊息層、任務排程層和資料層的多活容災架構優化和加固,自上而下的的流量穿透優化,容災能力整體穩定性提升 50% 以上。

  • 同城零改造,異地容災改造工作量下降 20% 以上。

同城場景下,業務零改造,平均 3h 內完成同城多活容災業務上線。異地容器業務場景下,依託 pilot 快速整合 agent,大大降低容災改造成本。

此次全面升級,讓業務技術團隊有了更多選擇,通過簡單、豐富、開放和低成本的 PaaS 服務,幫助企業客戶更簡單、更高效的進行在雲上創新,搭建更符合業務需要和團隊情況的技術體系。

版權宣告:本文內容由阿里雲實名註冊使用者自發貢獻,版權歸原作者所有,阿里雲開發者社群不擁有其著作權,亦不承擔相應法律責任。具體規則請檢視《阿里雲開發者社群使用者服務協議》和《阿里雲開發者社群智慧財產權保護指引》。如果您發現本社群中有涉嫌抄襲的內容,填寫侵權投訴表單進行舉報,一經查實,本社群將立刻刪除涉嫌侵權內容。

相關文章