全球科技基礎設施看亞馬遜雲科技,亞馬遜創新發布看re:Invent全球大會。從雲端計算到AI大模型,從底層到上層應用,作為全球科技行業領導者,2024年亞馬遜雲科技跨越科技發展的整個週期,AI大模型的跨越式發展以及基礎設施創新已經讓亞馬遜雲科技激發出全棧聯動的全新能力。
不久之前的re:Invent 2024給業界印象深刻的是亞馬遜雲科技在基礎設施領域的立體式創新,上層 生成式AI等資料能力與底層雲端計算包括儲存、資料治理、晶片和安全基礎設施領域的重大創新。
硬體效能在AI時代一騎絕塵
自研晶片長達十年,從一開始就圍繞創新、高效率、價效比佈局長遠。亞馬遜雲科技在AI時代才顯得遊刃有餘。
晶片是當前全球科技領域關注的焦點,亞馬遜雲科技在幾大雲端計算廠商中,這一方面的表現尤為突出,早在十年前就開啟了定製晶片之路。以自研晶片為代表的基礎設施能力不斷演進,極大地擴充了亞馬遜雲科技的創新邊界,進而為廣泛而深入的全棧雲和AI服務提供無限可能。
亞馬遜雲科技re:Invent 2024的一系列更新中,放在首日釋出的最重磅炸彈無疑是Amazon Trainium2,這也是亞馬遜雲科技高階副總裁Peter Desantis第一次將伺服器機架搬上主舞臺,此前該申請一直被拒。由此可見亞馬遜雲科技對Amazon Trainium2及其相關係列基礎設施釋出的重視程度,其超強的單伺服器效能是亞馬遜雲科技在縱向擴充套件領域的又一次突破,用以滿足大規模生成式AI訓練和實時推理的效能需求。
亞馬遜雲科技計算和網路副總裁 David Brown表示:“Amazon Trainium2是專為支援大型、前沿的生成式AI工作負載而設計的,能夠滿足訓練和推理的需求,並在亞馬遜雲科技上提供卓越的價效比。隨著模型引數接近萬億,我們意識到客戶需要一種創新的方法來高效訓練和執行規模龐大的工作負載。在亞馬遜雲科技上,全新的Amazon EC2 Trn2 UltraServers提供超快速的訓練和推理效能,幫助各類企業以更快的速度和更低的成本訓練和部署世界上最大的模型。”
同時,亞馬遜雲科技釋出了新一代AI訓練晶片Amazon Trainium3。Trainium3是亞馬遜雲科技首款採用3奈米工藝製造的晶片,在效能、能效和密度上樹立了新標杆。搭載Trainium3的UltraServers效能預計將是Trn2 UltraServers的4倍,使客戶在構建模型時能夠更快迭代,並在部署時提供卓越的實時效能。首批基於Trainium3的例項預計將在2025年末上線。
透過持續在諸如 Nitro、Graviton 和 Tranium2 等領域的核心創新投入,亞馬遜雲科技正在構建更強大的人工智慧伺服器。而持續的領先,來自於對硬體細節極致的追求。
亞馬遜雲科技的基礎設施立體擴充套件
亞馬遜雲科技透過大規模計算能力、專門設計的硬體架構和最佳化效能及價效比,顯著提升了單服務效能的縱向擴充套件能力。這些創新不僅提高了AI模型的訓練和推理效率,還降低了成本,為AI應用的廣泛部署提供了強大的支援。
其中,Amazon EC2 Trn2伺服器和Amazon EC2 Trn2 UltraServers超級伺服器都是為AI負載和設計,並提供快速擴充套件能力。Amazon EC2 Trn2 UltraServers擁有64個Tranium2晶片協同工作,提供比任何當前EC2 AI伺服器高五倍的計算能力和十倍的記憶體。亞馬遜雲科技高階副總裁Peter Desantis表示,“如果你要構建一個萬億引數的AI模型,這就是你需要的那種伺服器。”
在橫向擴充套件能力方面,10p10u則成為亞馬遜雲科技有史以來擴充套件最快的網路,在過去12個月中,安裝了超過300萬條鏈路;新型的SIDR網路協議則專為解決AI網路中光鏈路故障頻發、路由更新緩慢的問題而設計,能在1秒內恢復光纖網路中的故障,速度是傳統協議的10倍。
亞馬遜雲科技透過10p10u網路架構和SIDR網路路由協議,顯著提升了橫向擴充套件能力。10p10u網路架構透過創新的聯結器和定製光纖插頭,加快了安裝和維護效率,而SIDR協議則透過中央規劃和去中心化響應,顯著提升了網路的可靠性和實時性。這些創新確保了AI叢集在大規模擴充套件時的高效執行。
透過高效能運算能力、高效網路架構和資料中心創新,亞馬遜雲科技顯著提升了AI基礎設施的效能和可持續性。
底層基礎設施與上層AI等能力的全棧聯動
亞馬遜雲科技大中華區總裁儲瑞松在re:Invent 2024上表示,大模型只是生成式AI應用創新的一部分,要想真正做好生成式AI應用開發,還需要具備其他方面的能力,包括確保生成式AI能夠利用企業資料來增強大模型的能力、模型蒸餾以及安全和負責任的使用等等。為此亞馬遜雲科技推出了Amazon Bedrock平臺,為企業使用者和開發者提供了模型選擇、成本效能平衡、業務資料整合、模型推理最佳化、安全負責任使用等五大功能。透過Amazon Bedrock平臺,使用者可以更方便、更輕鬆、更快捷地實現生成式AI應用創新。
在底層平臺方面,Amazon Bedrock平臺的更新使得其可以支援更多的開源大模型;在系統軟體方面,Amazon SageMaker等產品的更新為使用者提供了更強大的資料處理和模型訓練能力;在上層應用方面,亞馬遜雲科技也推出了多個針對企業場景的服務,譬如Amazon Q Developer新加入的Transform功能就可以加速VMware和大型機工作負載的遷移和現代化,縮短轉型時間並降低成本。
亞馬遜雲科技大中華區產品部總經理陳曉建表示:“亞馬遜雲科技是全球雲端計算的開創者和引領者,更是企業構建和應用生成式AI的首選,今年re:Invent全球大會的一系列重磅釋出再次印證了這一點。我們不僅在雲的核心服務層面持續創新,更在從晶片到模型,再到應用的每一個技術堆疊取得突破,讓不同層級的創新相互賦能、協同進化。我相信,只有這樣全棧聯動的大規模創新才能真正滿足當今客戶的發展需求,加速前沿技術的價值釋放,助力各行各業重塑未來。”
有業內人士評價,亞馬遜雲科技始終圍繞彈性、安全、效能、成本、可靠性、可持續性為客戶創造價值。
亞馬遜雲科技大中華區總裁儲瑞松在拉斯維加斯現場採訪中表示:“這次re:Invent推出很多重磅創新發布,廣度和深度令人印象深刻,這充分體現了亞馬遜雲科技全棧創新聯動的能力。我們的創新既有底層雲端計算核心能力,也有上層資料分析尤其是AI方面的能力。上層創新需求驅動底層創新,而底層創新又為上層創新提供加速和支援。”