簡介:在雲原生帶來的雲端計算未來趨勢下,容器已經成為使用者使用雲的新介面。
阿里雲容器產品釋出近 7 年以來,已成長髮展為企業的雲原生作業系統,技術和服務能力日趨成熟,但創新從未止步。日前,阿里雲研究員 & 雲原生團隊負責人丁宇在阿里雲端計算峰會上宣佈容器服務 ACK 全面升級 ACK Anywhere,這一重要升級意味著 ACK 有能力在企業任何需要雲的地方,提供統一的容器基礎設施能力。
2021 年 10 月 21 日,在雲棲大會·雲原生峰會現場,阿里雲資深技術專家、容器服務負責人易立深度分享了阿里雲在容器技術領域的最新進展與探索,以及 ACK Anywhere 背後的思想及落地能力,同時宣佈多項重要升級和全新發布,使阿里雲容器服務全面發展為高效、安全、智慧、無界的下一代雲原生作業系統。
易立,阿里雲資深技術專家、容器服務研發和產品負責人
跨越鴻溝,容器加速雲原生普惠
阿里雲對雲原生的定義是“應雲而生”的軟體、硬體和架構。容器技術和服務可以為企業業務發展帶來三大核心價值:
- 敏捷高效。通過容器可以更好的支援 DevOps,優化研發和交付流程,同時提升應用的彈性與資源效率,使企業 IT 架構從容應對環境變化,降低計算成本;
- 加強韌性。容器可以降低使用者遷雲成本,同時更好地支撐微服務應用架構的部署與交付,使基礎設施和應用架構具備更強的韌性,更好地保護業務的連續性;
- 加速融合創新。越來越多的新技術,如 5G、AIoT、AR/VR 等,正在加速數字世界跟物理世界的融合。而無處不在的容器技術能夠加速這樣的融合計算新形態。
阿里雲容器服務支撐了集團 100% 應用的雲原生化,同時為雲上上萬企業實現現代化應用改造升級提供升級服務。從網際網路到零售、金融、製造、交通,越來越多的行業在利用創新的雲原生技術解決他們的業務問題。與此同時,容器也在支撐著更多行業場景創新,比如在智慧駕駛領域,模擬模擬需要海量的算力。只有雲端計算與雲原生技術能夠滿足業務算力的彈性、規模和效率的需求。
六大升級,釋放容器技術極致潛能
優化資源排程能力,全面支援新一代雲原生晶片
阿里雲今年重磅釋出第 7 代彈性計算例項,覆蓋了從 Intel、AMD 到 ARM 全新一代雲原生晶片,使單節點計算密度持續提升、單核計算成本持續下降。另一方面,隨著應用部署密度增加,必然帶來應用對 CPU 資源的爭搶、跨 NUMA 記憶體訪問等問題持續嚴重,導致計算效能降低。
為此,阿里雲容器服務 ACK Pro 針對新一代雲原生晶片優化了資源排程,可以更好地根據晶片核心架構優化程式和佈局,提升快取命中率,降低跨 NUMA 記憶體訪問,在記憶體密集型場景下實現 20% 至 30% 的效能提升。
同時,阿里雲容器服務正在與 Intel 合作,共同打造軟硬一體化的資源隔離保障方案,通過引入 RDT,HWDRC 等技術可以根據應用的 QoS 動態調整 L3 快取頻寬,將低優先順序任務對高優先順序任務的影響控制在 5% 以內,讓多種應用負載的混布具備更高穩定性。
軟硬協同、一體優化的新一代容器網路平面
阿里雲容器網路 Terway 帶來全新一代容器網路平面升級。通過與阿里雲洛神網路深度融合,基於神龍晶片 offload 虛擬化網路開銷,並在 OS 核心中通過 eBPF 實現容器 Service 轉發和網路策略,真正實現零損耗、高效能。相比Flannel等開源容器網路方案,在小包壓測場景中 Terway 吞吐量提升 30%,報文延遲下降 50%。
此外,新一代 Terway 內建全鏈路網路可觀測能力,通過 eBPF 技術,使使用者無需安裝任何外掛即可實現對容器網路的全面視覺化。
IPv6 已成為國家網際網路技術升級戰略的重要組成部分,阿里的容器網路聯合洛神網路相整合,實現了完整的 IPv6 雙棧解決方案,能夠在同一容器叢集中同時實現 IPv4 和 IPv6 兩種不同的網路協議棧,做到平滑升級,也能進一步簡化混合雲的網路互聯。
智慧、高效的新一代資源排程Cybernetes
企業正在將越來越多的工作負載執行於 Kubernetes 之上,微服務、AI、大資料等多樣化應用對資源提出多樣化需求。同時,雲上算力日益豐富,從面向通用計算的 CPU,到面向 AI 高效能運算的 GPU、NPU,算力層出不窮,這些都對容器化資源控制、隔離和排程能力提出新挑戰。
為此,阿里雲容器服務帶來全新升級的資源排程器 Cybernetes,為開源 Kubernetes 提供能力增強。以資料驅動的方式,根據應用執行時資源畫像實現智慧化排程和實時調整,簡化了應用資源配置的複雜性,有效提升了執行時穩定性,降低資源成本。
Cybernetes 具備三個關鍵特徵:
- 全相容:基於 Scheduler framework,與上游排程實現 100% 相容;
- 全場景:在同一個排程器上同時支援不同工作負載,真正帶來良好的資源混布;
- 智慧化:依賴於阿里雲資源排程領域 10 年技術沉澱,使用者只需宣告所需 SLO,即可由系統智慧化地實現 SLO 保障。
通過內部支撐驗證,相比開源實現,Cybernetes 在 AI 和大資料應用場景的排程效能可實現 300% 的提升,在保證業務穩定執行的同時讓資源成本下降 50%。
雲原生 AI 套件升級,全棧優化 AI 效能和成本
隨著企業對資料化和智慧化的重視,越來越多的企業希望利用 Kubernetes 來執行 AI 和大資料應用,能夠更好地實現技術棧的統一、資源池和技能棧的統一。
阿里雲針對大規模 GPU 的管理、排程和 AI 容器最佳實踐,推出 ACK 雲原生 AI 套件,基於 Kubernetes 全棧優化 AI 效能、效率和成本,助力使用者快速構建 AI 平臺:
- 通過 GPU 共享,在模型預測場景實現 100% 的 GPU 利用率提升;
- 在訓練場景,通過分散式快取加速,GPU 拓撲感知,使模型訓練任務加速 20%;
- 通過雲原生 AI 任務流,使 AI 工程效率整體提升 50%。
容器智慧化運維體系
Kubernetes 的複雜性是阻礙很多客戶採用的一個重要因素,尤其是在使用過程中遇到問題的時候,需要具備大量專業知識背景才可進行排查。為讓企業更簡單地使用和運維 Kubernetes 系統,ACK 構建了完備的容器智慧運維體系——
- 國內首個全託管節點池:全託管節點池除了具備自動彈性伸縮能力,也可以自動完成節點升級、CVE 修復、節點自愈等操作,讓使用者不用再操心 Kubernetes 節點管理的問題。
- 零侵入、低損耗的容器監控:可觀測是雲原生的核心能力。ARMS 容器監控基於 eBPF 提供無侵入、低損耗的容器資源和應用監控能力。
- 統一的成本優化、事件告警和安全治理:ACK 今年也釋出了成本中心、事件中心、安全中心,為公共雲、混合雲客戶提供精細化且統一的成本管理、事件告警和安全治理能力。
- 智慧化診斷能力:基於阿里雲容器團隊在 Kubernetes 上大規模實踐,利用資料化,智慧化技術對典型 Kubernetes 問題進行自動診斷,給出修復方案。目前包含 100+ 診斷項,覆蓋節點、容器、網路等超過 80 個場景,幫助企業及時處理線上問題,同時,對叢集中的穩定性風險進行巡檢,防患於未然。
容器映象服務企業版 ACR EE 正式商業釋出
ACR EE 是企業的雲原生資產管理平臺,面向安全需求高、分發效能需求高的容器企業級場景,如網際網路企業出海、跨國公司協作、線上教育、遊戲等公司,提供雲原生製品安全託管、高效分發的企業級解決方案,包括:
- 支援多種 OCI 製品託管,包括多架構容器映象(Linux、Windows、ARM 等架構的容器映象)、 Helm Chart、AI 模型等符合 OCI 規範的製品管理;
- 推出了對 X86/ARM 多架構映象的自動構建能力,簡化應用對多樣化算力的適配;並提供阿里雲官方認證的容器映象,比如 JDK 和 AI 映象,為應用提供帶來可信和高效的基礎映象實現;
- 完善映象分發加速能力:同時支援 ECS/ECI 千節點併發拉取,並將映象分發加速擴充至邊緣雲、企業資料中心;
- 雲原生應用交付鏈,全面擁抱 DevSecOps 理念,在容器軟體供應鏈中,對安全風險進行自動化分析、修復和阻斷。
三大核心釋出,
落地 ACK Anywhere 擴充雲端計算邊界
阿里雲今年宣佈了“一雲多形態”的部署架構,能夠讓一朵飛天雲執行在從核心地域到使用者資料中心的各個業務場景,為企業帶來本地化、低延遲的公共雲能力。ACK Anywhere 應運而生,進一步擴充雲的邊界,在企業任何需要雲的地方,提供統一的容器基礎設施。
ACK Anywhere 現在已經提供對中心雲、本地雲、邊緣雲、雲盒等公共雲形態的全覆蓋能力,以及包含專有云企業版、敏捷版等的多種本地部署形態。此外,不久前釋出的ACK 發行版可以部署在客戶 IaaS 之上,被公共雲統一納管。
此次雲棲大會上的三大核心釋出,將近一步落地 ACK Anywhere 擴充雲端計算邊界能力。
ACK ONE——容器融合管理平臺
ACK ONE 的價值理念是“雲生萬物,萬物歸一”。基於阿里雲提供的多雲、多叢集、多環境管理能力,ACK ONE 能夠同時管理阿里雲上叢集、邊緣叢集、部署在使用者客戶中心的叢集以及其他雲上的 Kubernetes,真正實現叢集的統一管理、資源的統一排程、資料的統一容災和應用的統一交付。
當企業遇到業務突發流量時,利用 ACK ONE 提供的彈性可以快速向雲上擴容;此外,利用 ACK ONE 企業可以同時管理分佈不同地域的 Kubernetes 叢集,實現統一的資源排程,根據叢集實際的空閒狀態將業務應用分發到不同叢集上執行,充分提升資源利用率。
ACK 備份中心——資料備份、容災、遷移一體化解決方案
ACK ONE 上提供了資料的備份、容災和遷移一體化解決方案,幫助企業實現多地域、混合雲的資料容災架構。
在阿里雲上利用 ACK 構建自己的資料庫管理平臺的企業,通過 ACK ONE 備份中心可以對資料盤進行定時的資料拍照,支援 TB 級資料的分鐘級備份與恢復,同時支援單機多盤的一致性保障。這些能力極大地提升了資料的整體穩定性。
邊緣雲原生一體機——軟硬一體化的雲邊協同解決方案
邊緣雲原生一體機是依託於阿里雲邊緣容器服務 ACK@Edge 的雲邊端一體協同、軟硬一體優化的解決方案,具備多樣化的硬體規格,可以部署在使用者現場,實現實時、穩定的近場計算能力。利用 ACK@Edge 提供的裝置孿生能力,我們可以將通過公共雲利用雲原生的方法,對海量的分散式的邊緣裝置和應用進行統一的管理。
以停車場景為例,企業可以基於邊緣雲原生一體機構建智慧化的停車管理系統,對路內泊位車輛的駛入駛離進行智慧化識別,並且將視訊和照片作為證據鏈儲存在雲端,實現停車管理智慧化、無人化。
攜手同行,未來可期
得益於社群的力量,阿里云云原生和容器技術快速發展。作為國內雲原生開源的領導者,阿里云云原生已向 CNCF 雲原生基金會貢獻 9 個專案,覆蓋邊緣計算、機密計算、混沌工程等不同領域。
源於社群,阿里雲容器服務也與更多技術夥伴展開合作,比如與 Intel、VMware 在機密容器、沙箱容器、雲原生邊緣計算等方向的共建,同時積極推進在阿里雲的產品化落地。
阿里雲容器服務期待與更多優秀合作伙伴、企業共同探索雲端計算的未來,構建高效安全、智慧無界的新一代雲原生基礎設施,助力企業加速雲時代的技術創新。
點選下方連結?,觀看雲原生峰會直播回放!
https://yunqi.aliyun.com/2021/agenda/session163
版權宣告:本文內容由阿里雲實名註冊使用者自發貢獻,版權歸原作者所有,阿里雲開發者社群不擁有其著作權,亦不承擔相應法律責任。具體規則請檢視《阿里雲開發者社群使用者服務協議》和《阿里雲開發者社群智慧財產權保護指引》。如果您發現本社群中有涉嫌抄襲的內容,填寫侵權投訴表單進行舉報,一經查實,本社群將立刻刪除涉嫌侵權內容。