阿里雲算力的十年更迭史,重點都在這了!

彈性計算百曉生發表於2021-04-06

3 月 29 日,在阿里雲端計算峰會上,阿里雲彈性計算負責人張獻濤博士,作為開場嘉賓,做了《高效穩定,助力雲上企業敏捷創新》的主題分享,回顧阿里雲算力的十年更迭史,講解阿里雲強勁、穩定、安全的計算產品家族。

 

以下為演講全文整理:

2020,與客戶一起打破不可能

2020年是不平凡的一年,一場疫情突如而至,我們的生活方式、工作方式,甚至是我們溝通的方式都發生了很大變化。同時,很多新名詞開始出現,比如雲辦公、雲科研、雲教育,很多學校也把畢業典禮搬到雲上,背後都是雲端計算的作用。

2020年,作為一家雲端計算公司,我們如何與客戶一起實現雲轉型?

疫情發生之初,科研人員需要用大量算力進行新冠疫苗與藥物研發。於是,我們第一時間宣佈免費開放算力提供給科研機構。在短暫的20多天裡,我們對接了國內20多家科研機構,提供免費算力。

第二個例子我相信很多朋友也深度參與其中。疫情讓居家辦公成為常態,小朋友也通過釘釘雲課堂進行線上的學習,過億人線上辦公,釘釘業務量激增,卻從來不崩。

釘釘之所以在這麼強大的業務壓力下,還能穩定服務,一方面是釘釘過去的五年的積累;另一方面,阿里雲也迅速擴容了上百倍的雲資源,確保釘釘每一項服務的穩定暢行。

同時,我們也支撐了不少線上教育行業的企業,比如猿輔導,他們同樣在疫情期間通過多個使用者量級上億的平臺為全國中小學生提供學習支援。這背後是大量的算力支撐,其實都是雲端計算提供的。

第三個例子,我相信很多企業也深有體感。疫情帶來的不確定性,讓企業對降本增效更為迫切。上雲便是降本增效的好途徑,申通快遞就是典型例子。去年,申通快遞的核心業務全面搬遷上雲, IT 投入降低 30%。

這背後的一切,都是雲端計算在起作用。

十年進化,鑄造三大核心技術

過去十年,阿里雲在產品技術經歷了多次突破和創新,有了深厚技術積澱,才能在特殊時期幫助客戶做好雲轉型。

2009 年,大家還在討論雲端計算時,阿里雲就成立了;2010 年我們釋出了第一個產品——彈性計算;2013 年,飛天 5K 隨著阿里巴巴集團最後一臺小型機下線;從前 12306 買票經常遇到各種卡頓,但是上雲之後,整個購票體驗提升了許多。

經過幾年的技術積累,我們釋出了神龍架構;2018 年又釋出了 ESSD 產品,儲存效能在全球達到第一;2020 年我們又實現了全面雲原生化。申通快遞也是使用了阿里巴巴雙 11 同款的上雲方案。

經過 10 多年的發展,我們打造了一套飛天雲作業系統。計算方面,我們有自研的神龍架構,管理百萬物理伺服器、千萬級 vCPU。洛神雲網路基礎設施,讓業務就近上雲。儲存方面,自研了盤古儲存系統,儲存了數十 EB 級別的資料,每年有上萬億次的資料和 API 呼叫。

通過計算、儲存、網路三者的結合,阿里雲端計算家族做到了業界領先地位,迄今服務了全球超過200多個國家和地區的幾百萬使用者。

強勁、穩定、安全的計算家族

在神龍、盤古、洛神,三大核心技術的加持下,我們的產品做到了強勁(高效能)、穩定、安全。

目前,我們正在研發第四代神龍雲伺服器,現在使用的是第三代。第三代神龍雲伺服器在儲存、計算、網路方面均擁有極致效能。

我們通過自研軟硬一體化的架構,大大提升了效率。神龍雲伺服器也是雲原生最佳載體,使用神龍伺服器執行容器的效能相比在物理機上執行提升 20-30%,也就是成本可以下降 30%。今天,神龍已經支援阿里雲全系產品。

AI 這幾年也很火,AI 所需要的加速器都比較貴,我們怎麼能夠為客戶降低成本?

我們自研了神龍 AI 加速器 AIACC,在使用同樣的硬體、同樣軟體的情況下,AIACC 能讓 AI 訓練與推理效能有大幅度提升。

儲存 ESSD 是基於雲上的分散式系統構建的雲盤,它的所有資料都是 3 份實時落盤,吞吐可以做到單盤 4 GB/秒。

大家在上雲的時候,使用更快的計算,更快的儲存服務,可以讓我們更好地在雲上做業務敏捷創新的同時,又可以降低成本。

在網路方面,自研的飛天洛神雲平臺,能夠讓使用者在雲上做到網路的絕對隔離,同時實現超大規模、超強效能和彈性可擴充套件的特性。

除了效能之外,客戶業務上雲的時候,更關注的是穩定

過去的十年間,我們從開始自研伺服器和自研加速器開始,所有軟體層全部自研。

通過自研,我們可以做到方便、靈活的開發。資料方面做到端到端的校驗,故障預測準確率達到99%,熱遷移技術讓客戶的業務在底層硬體故障之前就遷移到另外一個穩定的硬體上,確保業務不斷。這些自研技術,讓阿里雲端計算家族為客戶提供全球領先的穩定性。

基於領先的效能和穩定性,我們的產品依然在不斷迭代。最近我們的第七代ECS例項開啟了邀測,這代例項整體算力有40%以上的提升,全系搭載了安全晶片,在資料安全方面可以做到上雲無憂。

 

阿里云云盒正式開啟公測

公有云雖好,但是公有云都是在各大資料中心裡面,很多客戶的業務會有一些本地部署的需求,我們研發了阿里云云盒。雲盒可以把公有云延伸到客戶的身邊,就近解決對計算的需求。

 

阿里云云盒比較適合的場景,包括本地的資料處理,因為頻寬或者成本、資料量等原因,不方便傳到公有云上,公有云可以延伸到你的身邊,解決掉本地的資料處理問題。

我們經常提邊緣計算,需要就近去選擇接入點,雲盒可以延伸到邊緣,也是邊緣雲的一種非常好的解決方案。

 

資料就在你的身邊,大家不用擔心資料上雲之後會有安全或者是隱私問題。

除了剛剛講的業務系統上雲,疫情發生之後,我們看到越來越多的企業,把自己的辦公系統也遷移到雲端。這就很適合使用去年我們在雲端計算大會上釋出的無影。

很多企業在意的是自己的無形資產,如程式碼、核心演算法等,而不是像電腦或者是一般的有形資產。通過安全雲桌面的形式,可以做到所有的程式碼都不用落地。

阿里雲端計算:數字創新的原動力

為了能服務好客戶,我們已經構建了能夠覆蓋全場景的阿里雲端計算家族。

在雲的形態上,我們有公共雲和混合雲;雲上構建了多雲化的解決方案,有針對大資料的、也有針對AI的,能夠讓行業客戶上雲無憂。

同時,我們與生態夥伴合作,讓客戶可以一站式將把所有的業務遷移到雲端,幫助政府、零售、金融、交通類的客戶,將核心業務平滑上雲。

最後,我們希望通過十多年打造的強勁、穩定、安全的雲端計算能力,再加上企業級的服務能力,讓我們客戶雲上業務做到穩定永續、敏捷創新、智慧彈性、簡單觸達全球。

相關文章