雲端計算的未來在哪?破解亞馬遜雲科技增長神話

六一發表於2022-06-08
本文轉載自公眾號:CloudTech2030
文章僅代表原作者個人觀點

之前看亞馬遜雲科技創新大會直播,尤其是顧凡的主題演講“重構雲底座,加速向未來”,相比 re:Invent 的隆重的會場和豐盛的議題,這次更能總覽亞馬遜雲科技全域性產品和方案,我恰好在思考中美雲端計算的發展,本文有感而發。

雲端計算被形容為自來水,方便快捷。早年自來水沒有表,按人頭交錢浪費嚴重。僅剩一些農村這麼幹。可是你能想象到嗎,中國的雲端計算過去十年跟農村自來水一樣。終端使用者不省錢,服務商也不賺錢。

本文有點兒長,先說結論。亞馬遜電商有一套飛輪增長哲學,雲端計算業務也同樣採用類似增長飛輪策略。“主動降價”增加客戶粘性、“架構創新”客戶實現業務價值,看起來簡潔易懂,卻蘊含著深厚的產品哲學。眾多跟隨者求而不得,無法模仿,我們來解讀亞馬遜雲科技的產品之道,破解雲端計算增長之謎。

重構雲底座

相對於總部的 re:Invent 大會,中文版的直播更好理解,而且資訊濃縮,看一遍不過癮,又看回放。終於“會當臨絕頂,一覽眾山小”。keynote 關於雲底座基礎架構產品的演講,讓我從更全域性的角度,再次認識雲端計算產品戰略。縈繞在心中的問題,逐漸有了答案。為什麼那麼多使用者選擇亞馬遜雲科技,為什麼 620 億美元的規模,增長率還能達到 37%?

雲端計算產業的問題和思考

“亞馬遜雲業務 2021 年總營收 622 億美元,同比增長 37%。四季度營收 177 億美元,同比增長 40%。全年營業利潤 185 億美元,營業利潤率為 29%。”年初看到這條新聞,感嘆這麼大的營收規模,如此高的利潤率,是否因為繫結客戶,產品定價過高?

反觀國內的雲端計算虧錢降價策略,這樣難道不應該更能做大市場嗎?

先說結論,亞馬遜雲科技採用智慧的產品定位和不同定價戰略,聰明地為客戶省錢,同時獲得利潤投入技術創新和全球化。前文是總體戰略的增長飛輪,以下是產品角度的分解。

雲產品的增長飛輪:

對比雲端計算廠商的增長刺輪(部分跟隨者),刺輪需要額外推力才能保持運轉,比如客戶補貼,重投入客戶關係,定製化等。這也許就是很多廠商持續虧損,份額卻無法增長的原因。

雲端計算為客戶創造價值

到目前為止雲端計算還沒有顛覆性技術發明,還沒有人講清楚未來它的價值在哪,有多大?

顧凡引用了 McKinsey Quarterly 報告,“到 2030 年雲端計算為 500 強創造價值規模超一萬億美元,節約成本 4300 億,創造價值 7700 億”。成本節約大大降低客戶自建 IT 軟硬體成本,同時,利用雲上更加易用的 AI 和大資料技術,為企業業務創造價值。

文章有點長,我們們用麥肯錫的金字塔思維框架,結論先行。

雲產品使用者粘性和競爭力有以下 3 個方面:

  1. 節約成本:重新定義IT採購模型,幫助客戶優化成本,實現雙贏
  2. 創造價值:圍繞使用者價值重構雲底座,從晶片到資料全棧構建先機的計算、產品和服務
  3. 全球化:通過全球化網路和資源佈局、本地化合規、資料安全,幫助客戶全球化

後面主要從前兩個方面分享我的思考。

本文先重點討論 1 和 2。

1. 重新定義IT,實現成本節約

還是結論先行,亞馬遜雲科技為客戶節約成本,不靠低價格,而是靠貼近使用者 IT 模型的產品定義。比如按量付費的 Amazon EC2,承諾用量的節省計劃,到靈活切分的容器,低價搶佔的 Spot,無伺服器的 Amazon Lambda,再到自動降級省錢的 Amazon S3。

比如 Amazon EC2 的按秒付費,比常規包年的價格雖然單價高 50%,如果你的應用 1 天內高負載時間低於 16 小時,按量付費就更省錢。聰明的產品不靠低價,而且雙贏。

傳統 IT 玩法

過去:IT 老兵都知道,這個領域過去的玩法。IT 軟硬體產品市場操作複雜,有廠商-渠道-代理-整合商,代理還分總代/一代/二代。廠商還要建團隊去管理渠道、管理價格體系、行業/區域/代理級別折扣體系都不一樣,還要防竄貨,廠商花費大把資金用來做渠道激勵和管理。

從客戶側看,甲方企業還要養著一個強大的採購團隊,議價、比價、入圍、簽單,中間環節複雜且不透明,甲方老闆也不放心,還需配套後端廉政、合規、審計。

比如我們常見的企業級高階伺服器、儲存、網路和安全產品定價官網是查不到的,折扣範圍巨大,最低可以到 1 折,也可以 5 折。議價能力弱的客戶,就需要找多個渠道詢價,各種供應商比較,各種手段壓價。本來 1 個月可以下單到貨,經過多倫博弈要折騰半年,然後多家組合整合,再用半年來交付。

其他玩家捆綁大法

雲端計算被形容為自來水,方便快捷,按需使用,按量計費。但是最早是沒有水錶的,按月收費,現在還有農村這麼操作。結果喝水的嫌貴,賣水的虧錢,只有澆田的沒意見。
可是中國的雲端計算過去的十幾年就是這麼幹的。主要售賣方式就是包年包月。看起來折扣低,終端使用者沒有省錢。終於想通了,要改變模式,卻發現彈效能力不夠、售賣率不行...  增長飛輪別人無法無法模仿。

參見某雲產品 3 年價格調價通知:

2. 亞馬遜雲科技從哪些產品方面為客戶考慮?

1)持續降價的產品戰略

客戶選擇雲端計算,綜合評估 TCO、效能、可靠安全,體驗和服務能力;

如果服務商用低價來搶單,要小心是否有陷阱,是否會以次充好?是否先進店後宰客?超低折扣能否長期持續?

亞馬遜雲科技產品數十次降價,當相對其他玩家來講,不採用低價策略,而是雙贏的產品設計策略,值得思考。

我們接下來重點分析營收主力產品。企業的 IT 開支 IaaS 一般佔大頭,其中最大的產品是計算、儲存加起來一般超過 50%。我們來看看雲廠商的產品策略。

2)越來越輕的產品架構

從應用架構上節約:

虛擬機器 Amazon EC2--> 容器 Amazon ECS/EKS--> Amazon Fargate--> Amazon Lambda

從過去物理伺服器的形態,到越來越細粒度的切分,最終實現僅呼叫時佔用資源。資源開銷可以更加貼近客戶的IT負載曲線。減少浪費,幫客戶省錢。

從定價模式上節約:

按量付費-->預留例項-->節省計劃--Spot,主打按量付費的同時,給使用者多種靈活選擇。

3)堅持按量付費模式

雲端計算提供的是服務與傳統 IT 最大的區別,就是按訂閱收費。常見的軟體訂閱一般按照月或者年的方式。但亞馬遜雲服務更加激進,服務訂閱按秒付費(最小 60 秒),不做長時間繫結,恰恰解決了客戶 IT 峰值痛點問題。按照當前的定價比例,如果每天使用時間低於 16 小時,按量比包年更划算。

表-多種付費方式的差別

長期堅持按量計費,提供多種彈性方案和定價策略,培養市場對按量使用資源習慣,自己也孵化出 Serverless 產品。從本次演講也可以看出,客戶彈性用的非常普遍。每天新建立 6000 萬個例項,按照每例項 4vcpu 估算,代表 300 萬臺伺服器,雲上超50% 應用負載採用彈性方式建立。

過去 IT 服務廠商硬體裝置無法實現按量訂閱,只能按峰值需求採購。但是國內其他雲廠商為什麼不跟隨?為什麼還主推這種模式(很多服務商希望用低價包 N 年方式繫結客戶)

本質來看,付費包服務商需要預留資源、容量、效能,保證在需要彈性的時候,兌付成功率高。背後需付出巨大的成本來支援,預留充足的伺服器資源池;還要建設規模足夠大的可用區機房並支付成本。亞馬遜雲端計算在美國本土的 Region 一般 3-4AZ,國內服務商 AZ 數量經常達到 2 位數。節約短期成本,卻造成資源池碎片化,影響客戶彈性擴容體驗。

4)搶佔式例項--共享資源新正規化

B2B 共享資源的新正規化,閒置資源拍賣

使用 Amazon EC2 Spot 例項,可以請求 Amazon EC2 備用計算容量,與按需例項的價格相比,這類例項最多可以節省 90% 的成本。

計算過去 30 天內與按需相比節省的費用

中斷頻率表示 Spot 在過去一個月間回收容量的比率。

過去按量售賣,客戶峰谷會非常多,削峰填谷非常難排程,導致經常有 30-40% 的限制,採用 spot 方式,可以低價搶佔剩餘資源。

實際上有不少做算力的公司把這種空餘資源低價買入,分發給需要計算的客戶;比如平行計算類似玩家,二次售賣 HPC 業務。

5)手中無劍--開創無伺服器新賽道

一個做雲伺服器起家的服務商,竟然開啟了無伺服器新賽道。頂級高手追求手中無劍,心中有劍的層次。

基礎設施無論怎麼按量、彈性的方式使用資源,讓人有 scale-out 水位,一般應用工作水位 30%,啟動擴容的水位是 50-70%,縮容更加謹慎,需要等例項內的最後一個客戶服務結束。

開創性地釋出產品 Amazon Lambda,完全按照業務負載付費,把資源佔用和浪費壓縮到 0。

Amazon Lambda 費用=計算時間+請求次數+記憶體+儲存+併發。

我們們看一個官方案例,一個具備峰谷特點的外賣訂餐系統;每月處理 300 萬個請求。函式計算實現執行時間為 120 ms,每次記憶體 1536 MB。扣掉 100 萬免費額度,一個月下來才 20 美元;

當然,Serverless 還不是萬能的,僅支援指令碼語言、啟動慢(50ms+)、有呼叫限制。

6)自動省錢的 Amazon S3

Amazon S3 是物件儲存,是亞馬遜雲科技營收最大的儲存產品。從開發中角度,資料在產生之時,並不知道未來如何使用,未來算冷還是熱資料。而 Amazon S3 儲存提供了冷熱自動分級,超過 90 天不用,可以自動降級;

我想問一個問題,這麼主動幫客戶省錢,PD 不用承擔營收 KPI 嗎?

設計一個產品儘量從客戶那兒多收錢,這才是職業化的 PD 。

Amazon S3 不只是一個產品,而是一個系列,有多種熱度和效能的存續正規化。

Amazon S3 的產品價格隨著用量增加,單價下降。按照我的期待,容量達到 PB 後應該繼續降價。後面應該留給了銷售去申請折扣。

美中不足的是,Amazon S3 的收費複雜度,由六大成本組成:儲存定價、請求和資料檢索定價、資料傳輸和傳輸加速定價、資料管理和分析定價、複製定價以及使用Amazon S3 Object Lambda 處理資料的價格。

如何選擇趁手兵器--購買方式總結

大膽設想,目前大客戶還是有額外折扣的,有額外議價空間,未來的產業網際網路,按照採購量自動生成階梯折扣,更加透明,期待有云廠商早日邁出這一步。

主動幫助客戶省錢,這也許是敢於用按量收費,而且客戶粘性越來越強的原因。

成本管理和優化工具的七種武器

好的產品設計要對財務友好,企業IT部門每年都有降本 KPI。亞馬遜雲科技有如此多的工具組合,功能強大,很多賬單還可以匯出 excel,二次架構處理。

豐富的工具包:

a.Amazon Pricing Calculator 在亞馬遜雲科技中國區域估算雲使用成本
b.產品內建:購買介面內建多種選項建議,比如 Saving Plan,輸入需求,自動給出建議。
c.雲上財務管理 (CFM) 使組織能夠調整其流程以實現最大的業務價值和財務成功,同時優化亞馬遜雲科技上的成本。
d.Amazon Cost Explorer 檢視和分析您的成本和使用情況。該工具提供預設報告,可幫助您直觀地檢視成本和使用情況(例如賬戶,服務)或資源級別(例如 Amazon EC2 例項 ID)
e.Amazon Trusted Advisor,這是一種線上工具,可幫助您按照最佳實踐在五個方面配置資源:成本優化、效能、安全性、容錯和限制。建議定期使用 Amazon Trusted Advisor 以最佳方式維護您的解決方案。
f.Amazon Compute Optimizer 會為您的工作負載推薦最佳例項種類及規格大小,以降低成本並提高效能,並使用機器學習來分析歷史利用率指標。過度配置資源會導致不必要的基礎設施成本,而資源不足會導致應用程式效能不佳。幫助您根據您的利用率資料為三種型別的資源選擇最佳配置:Amazon EC2 、Amazon EBS 、Amazon Lambda。
g.Amazon QuickSight 成本視覺化方案

技術創新圍繞客戶價值

自底向上的基礎技術創新-晶片

亞馬遜雲深耕客戶 IT 多年,為雲原生場景設計晶片,從減少虛擬化損耗開始,逐步接管客戶通用負載、ML 負載:

Amazon Nitro:就是支援虛擬化的智慧網路卡,帶火了 DPU 概念。快速創新,效能讓利給客戶
Amazon Graviton:基於 ARM 架構的 CPU,如今已經發展到可以在生態、效能方面趕超 x86的水平。
Amazon Trainum 和 Amazon Inferentia:分別是 ML 的訓練和推理晶片,對比 NVIDIA GPU 價效比更高。

Amazon Nitro 加速應用效能

亞馬遜雲科技早在 2006 年就推出了 Amazon EC2 虛擬主機服務,早期可用的虛擬化技術只有 VMware 商業軟體和開源的只有 Xen 技術,KVM 剛剛誕生還未成熟。

Xen 的虛擬化採用全虛擬化技術,也就是靠軟體虛擬出記憶體、IO、外設等裝置,CPU 效能損耗達 20-30%,主流雲服務商都切換到了 KVM,2013 年收購了 Annapurna labs。還在忍受低效的老技術。被 VM 效能吊打兩年後,終於在 2017 年釋出了Amazon Nitro 和 Amazon Nitro hypervisor,實現優化虛擬化負載。

表-Amazon EC2 Virtualization Types

過去 KVM 軟體虛擬化雖然實現了 SRIOV,但是 vNIC、vBlock 裝置還是需要大量核心來處理裝置 IO,與應用負載爭搶 CPU 資源。負載的比例大概 10-20%。採用 Amazon Nitro 硬體虛擬化技術幫客戶應用實現效能提升,同時意味著降低資源需求,降低成本:

Memcahed:Amazon Nitro 領先 9-26%
Nginx:領先 11-20%
MySQL:領先 6%

Amazon Nitro SSD 優化儲存時延:從 0.08ms 降低到 0.02ms;資料庫、ML 需要更低時延提升應用響應速度。過去應該採用商用方案,現在 Amazon Nitro 加速,實現 SSD 虛擬化,統一監控和管理,且降低時延。

Amazon EC2快速推出新例項

亞馬遜雲科技主要以服務形式提供給客戶,後臺技術迭代,客戶不需要感知,一個產品系列型別可以收斂到 1-3 個形態。但計算產品不同,客戶的應用會感知到 CPU 平臺的差異,不同應用也有不同的需求,這導致 Amazon EC2 產品例項系列快速爆炸,比如 CPU 分為 Intel、AMD、ARM,記憶體分為1:2、1:4、1:8 和 1:16,加速器分為推理、訓練、FPGA、媒體轉碼,此外還有 IO 增強,如網路增強、本地盤等形態。幾種組合,每一代有數十種硬體架構形態。亞馬遜雲科技可以快速推出新例項,得益於Amazon Nitro 實現了虛擬化解除安裝。

自研 Amazon Graviton-高效能低價格

隨著 Intel 這幾年擠牙膏,伺服器處理器的價效比提升放緩,尤其是能耗快速增長。亞馬遜雲科技推出 ARM 處理器 Amazon Graviton 2 和 3 系列。

最近分析 ARM 技術,推測應該採用的是 Nerverous V1 架構,代號 Zeus,比 N1 核效能提高 50%(實際 SVE 提升更大)

創新的雲原生晶片設計理念:

  • 效能:單核記憶體頻寬和時延
  • ML:BF16 和 INT8 方面遙遙領先
  • 能耗:功耗是 ARM 強項,效率比 x86 優 60%
  • 放棄:隨著核心增加 NUMA 作為獨木橋,越來越影響效能,乾脆放棄NUMA
  • 場景:單 core 效能強勁,HPC、媒體轉碼場景具備優勢;

Amazon Graviton 3 比 G2 增加 200 億電晶體;但是處理器主頻不增加,核數沒變,推測戰略定位如下:

  • 效能戰略:選擇了 V1 架構,意味著走了效能路線,主打 ML 和 HPC
  • 成本更高:Amazon Graviton 3 僅 64core,相比較而言行業其他處理器的核密度更高,Ampere AltraMax、Yitian、NVIDIA 分別是 128core 和 144core(2chips) 
  • 讓利客戶:Amazon G3 例項 C7g 定價只比上一代 Amazon G2 提高 5%;5nm 500 億電晶體,比7nm 300 億電晶體成本預計翻倍。

ML晶片賦能AI場景

  • 成本降低 70%
  • Alex 都已經轉到 Inf1 例項
  • 成本降低 35%
  • 吞吐提升 2.3 倍

EFA 支援 SRD 協議,幫助客戶優化 HPC、ML 並行能力,減少 TCP 通訊開銷佔比。

雲上創新技術賦能業務

AI 賦能業務

CTO 格言:每一行程式碼都是業務邏輯。從 OPPO 案例可以看到,採用雲上 Amazon EC2-Inf1,快速構建語音助手的案例。

智慧運維

亞馬遜雲科技利用自身電商積累的經驗,通過亞馬遜雲科技雲服務幫助客戶運維。包括對事件的分析、響應進行的機器學習.比如 trusted advisor,為客戶提供超過 5000 萬智慧運維推薦。根據 Amazon 電商積累的經驗,輸出給客戶,此外還有 IEM 等工具。

資料價值

資料為客戶創造這塊兒也很精彩,可以讓只懂 SQL 的人玩轉 AI。先不做詳述,我把回放連結放在文末,感興趣可以瞭解下。

資料服務提供:

冷熱資料快速恢復
資料備份、安全
Amazon S3-redshift,打通湖與倉
資料安全,審計策略
用 SQL 實現 ML 創新

思考和啟發

因為價值所以選擇

通過為客戶節約成本,創造業務價值,讓亞馬遜雲科技受到全球使用者歡迎。另外,雲端計算消耗佔半壁江山的網際網路企業,告別內卷奔赴全球化是 2022 年主題,全球化需要強大的安全、合規特性產品能力,需要全球網路。因此國內企業出海紛紛選擇亞馬遜雲科技。

根據統計報告,雖然在國內市場亞馬遜雲科技只佔 6%,但加上中國企業出海份額佔到了 26%,足以說明亞馬遜雲科技強大的競爭力和客戶粘性。

亞馬遜雲科技的祕籍你能學會嗎

IT 服務商存在的意義就是為客戶創造價值。最後我提幾個問題,你的企業文化真的是客戶第一嗎?今年營收 KPI 和客戶粘性需要犧牲一個,你怎麼選擇?

破解了雲端計算增長之謎,亞馬遜雲科技的產品之道,你能學會嗎?
(完)碼字不易,請點贊支援
前文說過,很多地方本文沒有探究,愛好技術的喜歡刨根問底,附一個回放入口自己去看。

相關文章