2021 亞馬遜雲科技 re:Invent 剛剛落下帷幕,許多開發者都在討論今年亞馬遜雲科技 re:Invent 的重磅釋出。
這並不奇怪,每年亞馬遜雲科技 re:Invent 都會有數十項新產品、新功能釋出,其中一部分,可能代表了日後雲端計算及整個 IT 界基礎設施的發展方向,比如曾經的 Amazon RedShift、Amazon Lambda,前者引導了業內雲原生數倉的發展,後者則把無伺服器帶進了業內開發者的視線。
但今年的亞馬遜雲科技 re:Invent 有些不一樣,除了在產品效能上的常規迭代,更重要的是體現了雲端計算的服務在概念上的延伸。最為典型的,便是 Amazon IoT TwinMaker 與 Amazon IoT FleetWise。
元宇宙與物聯網:世界真的在雲化
據官方介紹,Amazon IoT TwinMaker 是一款可以讓開發人員更加輕鬆、快捷地建立現實世界的數字孿生,如樓宇、工廠、工業裝置和生產線。使用者可以通過 Amazon IoT TwinMaker,使用數字孿生來構建反映現實世界的應用程式,提高運營效率並減少停機時間。
數字孿生是物理系統的虛擬對映,可根據其所代表的現實世界物件的結構、狀態和行為定期更新。Amazon IoT TwinMaker 讓開發人員可以輕鬆彙集來自多個來源(如裝置感測器、攝像機和業務應用程式)的資料,並將這些資料結合起來建立一個知識圖譜,對現實世界環境進行建模。
數字孿生技術最早是用於航空航天飛行器的健康維護與保障,屬於冷門技術。但隨著“元宇宙”概念的興起,數字孿生技術越來越為人所熟知,因為數字孿生的本質特徵是在資訊世界對物理世界進行等價對映,因此成為元宇宙概念的重要支撐技術之一,尤其是工業元宇宙,應用更是廣泛。
亞馬遜雲科技 re:Invent 這次釋出 Amazon IoT TwinMaker 可以說,既與元宇宙相關,也與工業網際網路有關。從前,雲端計算的服務範圍,聚焦在網際網路產業,面向所謂的傳統產業,主要提供轉型服務。但現在,雲端計算的服務外延正在飛速擴充套件,通過元宇宙這座橋,已將範疇擴大至整個物理世界的虛擬化對映。
與此緊密相關的是 Amazon IoT FleetWise。Amazon IoT FleetWise 使汽車製造商可以輕鬆地收集和管理汽車中任何格式的資料(無論品牌、車型或配置),並將資料格式標準化,方便在雲上輕鬆進行資料分析。當資料進入雲端後,汽車製造商就可以將資料應用於車輛的遠端診斷程式,分析車隊的健康狀況,幫助汽車製造商預防潛在的召回或安全問題,或通過資料分析和機器學習來改進自動駕駛和高階輔助駕駛等技術。
如果說 Amazon IoT TwinMaker 提供的是從現實世界到虛擬世界的對映服務,那麼 Amazon IoT FleetWise 就是聚焦車聯網領域,解決的是車聯網長期以來的發展問題。車聯網概念最早出現於 20 世紀 60 年代,但 60 年來,一直有點“瘸腿發展”的意思——大部分人對車聯網的理解是,在車內提供網路服務,而不是將車輛資料上傳分析。
直到 2012 年特斯拉 Model S 出世,才把車聯網作為必選功能,納入汽車生產製造的流水線裡。現在 Amazon IoT FleetWise 釋出,把車聯網相關服務全面引上雲端。
Amazon IoT FleetWise 的一個重要特徵是,可以在雲中構建車輛的虛擬表示,並應用通用資料格式來構建和標記車輛屬性、感測器和訊號。Amazon IoT FleetWise 使用車輛訊號規範 (VSS) 對車輛建模進行標準化,以便“燃料壓力”等訊號始終表示為燃料壓力,並以每平方英寸磅力 (PSI) 和千帕 (kPa) 為單位進行測量。車輛建模後,上傳標準 CAN 資料庫 (DBC) 或 AUTOSAR XML (ARXML) 檔案,以便 Amazon IoT FleetWise 可以讀取通過車輛控制器區域網匯流排 (CAN 匯流排) 傳送的獨特的專有資料訊號。
看懂了吧,其實 Amazon IoT TwinMaker 和 Amazon IoT FleetWise 的底層理念如出一轍,都是在雲端構建虛擬對映,不過一個是針對工業領域,一個是針對汽車行業。可以說,這個世界正在虛擬化,同時也正在雲化。
Amazon SageMaker Canvas:無程式碼建立 ML 模型
如果說 Amazon IoT TwinMaker 和 Amazon IoT FleetWise 體現了雲服務在橫向上的概念延伸,那麼 Amazon SageMaker Canvas 則是在縱向上的概念延伸。
大家都知道 Amazon SageMaker ,作為一個已釋出四年的全託管機器學習服務。Amazon SageMaker 為開發者提供了一套完備的“中央廚房”,使用 Amazon SageMaker 開發者只需準備好“食材”(資料)就可以直接開始做菜(訓練模型),大大提升了開發人員和資料科學家構建、訓練和部署機器學習模型的效率,開啟了全新的智慧時代。
但 AI 領域長期受到人才短缺問題的限制,而 AI 的應用領域正在增多,機器學習服務的門檻需要進一步降低。亞馬遜雲科技此次釋出 Amazon SageMaker Canvas 的目的即在於此 —— 用無程式碼理念構建機器學習模型,做模型預測,保證在脫離資料工程團隊的情況下,依然可以提供服務。它利用與 Amazon SageMaker 相同的技術自動清理和組合您的資料,在幕後建立數百個模型,選擇效能最佳的模型,並生成新的單個或批量預測。支援二元分類、多類分類、數值迴歸、時間序列預測等多種問題型別。
此前業內還有許多關於低程式碼、無程式碼的爭議,但現在看來,這不是概念之爭,而是產業內有確實的需要。Amazon SageMaker Canvas 的釋出即是驗證了這一情況。
站在整個 AI 的巨集觀層面而言,無論是基於 AI 提供的預測服務還是分析服務,也脫離了單純對更高階別人工智慧的追求,而兼顧 AI 能力對產業的賦能。這是雲端計算對服務理念的進一步擴大和貫徹。
Amazon Private 5G:用專有 5G 連結 IoT 裝置
而在這種情況下, Amazon Private 5G 的釋出,自然也被許多人所關注,因為它是支撐服務外擴的重要和必要嘗試。可以說,Amazon Private 5G 是本次 re:Invent 最重要的釋出之一。
在移動端,我們早就用上了 5G 通訊服務,但企業需要的是專有 5G 服務網路。Amazon Private 5G 可自動設定和部署網路,並按需擴充套件容量以支援更多裝置和網路流量。亞馬遜雲科技 EC2 副總裁 David Brown 說:“藉助亞馬遜雲科技私有 5G,我們將混合基礎設施擴充套件到客戶的 5G 網路,以簡化、快速且廉價地建立私有 5G 網路。客戶可以從小規模開始,按需擴充套件,按需付費,並從亞馬遜雲科技控制檯監控和管理他們的網路。”
而 Amazon Private 5G 也重點服務了以工業 4.0 為主的龐大感測器和端側裝置叢集,前文提到的工業元宇宙、車聯網自然也在同一序列。
全球最大的非上市公司——美國科氏公司工業集團(Koch)已經和亞馬遜雲科技就 Amazon Private 5G 達成了合作,而科氏企業集團的核心是石油與化工,也是亞馬遜雲科技比較有代表性的服務案例。
Amazon Graviton3:底層算力又升級了
當然,不管是 Amazon IoT TwinMaker 等 IoT 服務,還是 Amazon Private 5G,依靠的還是底層例項中的晶片效能。在今年的雲棲大會上,阿里巴巴旗下半導體公司平頭哥釋出自研雲晶片倚天 710 並宣佈其效能超過 Amazon Graviton2 20%。
從2019年 Amazon Graviton,2020年 Amazon Graviton2 到今天的 Amazon Graviton3,亞馬遜雲科技從晶片開始不斷改進計算服務。與 Amazon Graviton2 相比,Amazon Graviton3 整合了550億個電晶體,單核效能提升超過25%,浮點和加密效能將提高兩倍。在機器學習方面,Amazon Graviton3 包括對 bfloat 16資料的支援,將能夠提供高達3倍的效能。在效能飛躍的同時,Amazon Graviton3 能耗對比上一代產品下降了60%。
新一代Amazon EC2 C7g 例項由 Amazon Graviton3 處理器支援,也是全球首個支援DDR5內容的雲上計算例項。與由 Amazon Graviton2 處理器支援的當前一代 Amazon C6g 例項相比,效能提高 25%。
當然,Amazon Graviton3 屬於通用晶片,專用晶片也更新了。亞馬遜雲科技公佈,由亞馬遜第二款機器學習晶片 Amazon Trainium 支援的新 Amazon Trn1 例項,將為在雲中為自然語言處理 (NLP)、計算機視覺、搜尋、推薦、排名等用例訓練深度學習模型提供最佳的價效比,與 P4d 例項相比,通過 Amazon Trn1 例項訓練深度學習模型的成本降低達到 40%。
Amazon Nitro System 晶片也釋出了新品。Amazon Nitro 可以說是個超級黑科技,準確來講它是一個套架構,可以將伺服器提供給使用者的資源最大化,減少虛擬化損耗。所謂“虛擬化損耗”,就是以往為了維護服務其正常執行,在網路、儲存、管理等系統功能方面做出的必然開銷,這種開銷要佔到伺服器總體效能的三成。Nitro 架構就是通過定製硬體,關注這三成的效能問題。
而這次釋出的 Amazon Nitro System 晶片,主要是支援 Amazon EC2 Instance 底層管理平臺,可以替 CPU 分擔工作負載。通用晶片、推理專用晶片、 Amazon EC2 支援晶片,這次釋出的是整整齊齊。Amazon Nitro SSDs 的 Im4gn/Is4gen/ I4i 例項提供 30 TB 的 NVMe 儲存,與上一代 I3 例項相比,I/O 延遲降低了 60%,延遲可變性降低了 75%。
Data Serverless :無伺服器應用迅速推廣
當然,除了在網和端層面的服務能力擴充套件,此次在 Serverless 層面的更新也值得注意。
業內都知道 Amazon Lambda 開啟了 Serverless 的時代,但真正獲得業內的廣泛贊同和跟隨,還是在 2019 年。這次 亞馬遜雲科技 re:Invent ,亞馬遜雲科技一口氣釋出了四個核心產品的 Serverless 版本:Amazon Redshift Serverless、Amazon EMR Serverless、Amazon MSK Serverless 和Amazon Kinesis data streams on-demand。
Amazon Redshift 我們已經提過,是最早的雲原生數倉;Amazon EMR 則是亞馬遜雲科技提供的 Hadoop 託管服務;Amazon MSK 是 Kafka 託管服務;而 Amazon Kinesis data streams on-demand 則是流式資料處理平臺。
而這些服務的 Serverless 版本則是讓使用者單擊幾下即可執行使用這些框架構建的應用程式,而無需配置、優化或保護叢集。
雲端大資料架構,因為亞馬遜雲科技這些 Serverless 版本服務的更新,其門檻正在飛速降低。以往像智慧湖倉這種架構的搭建,讓架構師、工程師很頭疼,而現如今,工程師的工作正在變成單純的調參 —— Serverless 對產業生態的改變幾乎是永久性的。
寫在最後
從 2021 亞馬遜雲科技 re:Invent 及今年各雲端計算大會的釋出情況看,雲端計算領域的產品更迭,一是注重底層基礎算力的升級,這屬於硬核實力的比拼;二則是注重服務外沿的擴充套件,如何理解雲、網、端三個角色,並提供儘量通用的公有云服務,成為關鍵。元宇宙則是當下新興起的概念,為整體的技術發展方向提供了新的想法和方向,值得我們特別思考。