2024年,生成式AI如火如荼地迭代中,從文生文、文生圖到文生影片、音訊,生成式AI進一步強化。同時這一能力也開始大量應用到藝術創作、娛樂、金融、醫療、製造、汽車等多領域。麥肯錫此前估算,生成式AI每年對全球經濟的貢獻至多達7.9萬億美元。
作為全球雲端計算行業的領導者,亞馬遜雲科技在不久前落幕的2024中國峰會上,釋出了諸多與生成式AI相關的重大戰略、方案和合作計劃。越來越多的企業在業務中使用生成式AI。在生成式AI時代,技術架構演進如何安全穩定地進行,亞馬遜雲科技大中華區解決方案架構總經理代聞給出了一些新的思考。
在代聞看來,生成式AI的底層仍然是雲端計算核心能力來支撐。“只有在雲端計算的環境下,才有機會做這樣的從應用到CPU的全棧創新。亞馬遜雲科技為客戶提供的是雲端計算服務,所以能夠在不斷提升服務能力的前提下,保持內部全棧創新的靈活性。同時能夠了解到使用最多的應用及其資源消耗模式,以此來挑選對使用者來說收益最高的技術點來做針對性最佳化,快速改進軟體和硬體堆疊,甚至CPU設計。”
基礎元件能力決定了架構設計
生成式AI底層由雲端計算支撐,雲端計算的最基礎元件是計算、儲存和網路,其中又以計算作為最核心的元件。從Amazon Nitro到SRD、SIDR、UltraCluster、Nitro Enclaves、儲存、自研晶片Amazon Graviton,亞馬遜雲科技不斷創新贏得了客戶的認可。
回顧發展歷史,亞馬遜雲科技不斷為客戶打破技術和產品服務能力的上限。這些重要節點包括:
2017年亞馬遜雲科技對外宣佈了Amazon Nitro虛擬化平臺。將安全、管理和監控也解除安裝到了硬體上,將主機算力近乎100%地提供給客戶,並且進一步加強了虛擬化的安全。更重要的是,實現了虛擬化平臺和伺服器選擇的解耦,因此底層的虛擬化技術創新和上層的伺服器種類發展可以並行展開。回顧Amazon Nitro 的十年的發展歷程,亞馬遜雲科技已經發布了五代Amazon Nitro晶片。持續在網路效能、儲存效能 和 安全加固。獲得更低的延遲、更高的吞吐量以及每秒處理更多資料包的能力。
Amazon Nitro應用的2013年,Amazon EC2 C3系列虛擬機器獲得了萬兆頻寬。之後隨著Nitro創新,頻寬發展到100Gbps、400Gbps,直到現在的單機6.4Tbps,為大模型訓練提供了有力的保障。並且,最新Amazon Nitro支援的包轉發達到了30Mpps(Packets Per Second),即每秒處理三千萬個資料包。
在最新的Amazon Nitro 平臺支援下,單個虛擬機器的最大 IOPS 可以到 400K,儲存頻寬可以到 100Gbps。
過去5年, 亞馬遜雲科技釋出了四代Amazon Graviton。亞馬遜雲科技在全球規模化提供的基於 Amazon Graviton 的 Amazon EC2 例項種類達 150 多個,已經構建的 Amazon Graviton 處理器數量超過 200 萬個,並擁有超過 50,000 客戶。這些客戶涵蓋了Amazon EC2 最大的前 100 個客戶,他們使用基於Amazon Graviton 的例項為其應用提供最佳價效比。
架構體系創新擴充核心能力
在代聞看來,在架構體系創新中,韌性、彈性與效率是其中的關鍵。
為構建和執行世界上最可靠的雲,亞馬遜雲科技持續投入,在服務設計和部署機制中構建保障措施,並將韌性植根於運營文化之中。如何應對不可控制的外部風險,以及管理不善造成的內部風險,是技術架構韌性要解決的主要題目。如同橋樑的韌性一樣。
最近一段時間,雲服務自身的可靠性導致的事故原因大都與雲平臺的訪問控制核心服務相關,亞馬遜雲科技的Amazon IAM提供高可靠的訪問控制服務。Amazon IAM在每個區域的資料平面都採用了單元架構來實現高可用。單元架構,Cell-based Architecture,是一個架構設計方法,目的是最小化故障的影響範圍,降低“爆炸半徑”。基於多區域的控制面與資料面的隔離,基於區域內 單元架構,Amazon IAM實現了全球高可靠架構。現在,Amazon IAM每秒處理超過十億次呼叫,是毫無疑問的高韌性的安全基石。
就彈性和效率而言,亞馬遜雲科技的Serverless不僅是產品,更是一種構建方式。具有代表性產品Firecracker、Amazon Lambda SnapStartCaspian。
Firecracker輕量級虛擬化技術,旨在快速啟動和管理容器化工作負載,提升資源效率和安全性。Amazon Lambda SnapStart提升10倍冷啟動速度。Caspian實現了類似“多庫同宿主,允許共享預留”的邏輯。
多元技術融合驅動架構創新
生成式AI應用催生新的資料架構。生成式AI應用的雲上的參考架構比過去三層web應用架構和微服務架構完全不同,核心原因是多了一個或幾個響應沒那麼快的大模型。生成式AI應用的資料架構包括以下三個方面:
第一、在使用者互動側,不變的核心要求是響應時間要快
第二、在後端涉及資料流的更新,資料的ETL處理
第三、使用者和後臺中間的是大模型和使用者聊天的各種上下文資料,或是來自企業業務的“特定領域”的知識資料
整體應用架構是多元技術均衡的結果,需要考慮以上諸多因素,包括成本、合規、擴充套件性、可持續發展、韌性、安全、效能、訪問可達性、可用性等等。架構師的工作就是在不同的場景下對不同的需求,透過一系列的折中取捨持續最佳化。沒有一個架構是十全十美的。架構本身也受技術發展不斷影響,一個良好的架構應該能夠隨著多元因素的影響不斷演進。
亞馬遜雲科技的優良架構體系(Well-Architected Framework)到現在已經超過十年了,從四個維度(卓越運營、安全、可靠、效能效率),演進到六個維度,新增了可持續發展和成本最佳化。隨著客戶對各種元件更深入地使用。架構師的決定和元件選擇會直接影響到整塊的應用負載在雲上的成本。
生成式AI時代,技術架構演進應當注重什麼,代聞強調主要是兩個方面:什麼是變的。所有技術工作者應當主動擁抱 生成式 AI,積極地升級技能、積極地去應用這項變革性的技術;什麼是不變的。在技術架構的演進過程中錨定不變的原則,在技術變革的浪潮中找到前進的燈塔方向。