得AI者得天下。如果說過去AI大模型只是大公司競爭的焦點,而當下,企業擁抱大模型在持續加速。在亞馬遜雲科技大中華區產品部總經理陳曉建看來,很多客戶正在從原型驗證階段轉化為生產階段。客戶在這一階段的難點在於:需求將更加複雜,不僅是選擇模型,還需要各種技術支援。
(圖:亞馬遜雲科技大中華區產品部總經理陳曉建)
在亞馬遜雲科技2024 re:Invent中國行北京站主題分享上,陳曉建表示,同時使用多個模型的做法在行業中普遍存在。企業在選擇模型時,通常會基於效能、功能和成本進行權衡,根據不同場景需求,選擇高效能或低成本等不同定位的模型。
亞馬遜雲科技2024 re:Invent推出Amazon Nova六款基礎模型;Amazon Bedrock新接入100多款模型,並推出AI防護、多智慧體協作和模型蒸餾等重磅更新,全面最佳化推理場景的準確性、成本和響應速度;Amazon Q更加深入軟體開發和商業應用場景,併為傳統工作負載轉型開闢新途徑;Amazon SageMaker AI將幫助客戶更快更輕鬆地構建、訓練和部署模型。
生成式AI推理將成應用核心構建塊,未來應用需支援規模化推理平臺,利用專有資料,平衡效能、安全性和成本,模型選擇至關重要。
Amazon Nova系列模型
Amazon Nova甫一發布即成為全球領先基礎模型的重要力量,包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基礎模型,以及用於生成高質量影像的Nova Canvas和生成高質量影片的Nova Reel。在各自智慧類別中,Amazon Nova Micro、Lite和Pro應用成本比Amazon Bedrock中表現最佳的模型至少降低75%,同時也是Amazon Bedrock中對應類別速度最快的模型。
Amazon Nova系列模型,包括多種型別。Nova Micro是文字到文字模型,能以極低成本提供低延遲響應;Nova Lite為成本極低得多模態模型,可快速處理多種輸入;Nova Pro是功能強大的多模態模型,在準確性、速度和成本間平衡;即將推出的Nova Premier是其中能力最強的多模態模型,可處理複雜推理任務並指導定製模型蒸餾。
新一代影像生成模型Amazon Nova Canvas,它能幫助客戶生成高質量影像,還具備影像編輯功能,最高可以生成高達兩K(2000乘以2000)、2048乘以2048這樣的影像,並且使用者很快就可以透過Canvas這個模型進行微調。
新一代影片生成模型Amazon Nova Reel,以先進的影片生成質量和低延遲而自豪,提供了效能和成本效益之間的平衡。其文字到影片的功能,使使用者能夠透過簡單描述內容就可生成影片,實現了影片製作的普惠化;文字影片生成功能讓使用者可透過輸入文字和視覺來控制最終輸出,製作與願景匹配的影片。
來自poolside、Luma AI和Stability AI的Stable Diffusion 3.5模型等將很快在Amazon Bedrock上線。其中,poolside的兩款模型專為軟體開發流程打造,其模型在程式碼生成、測試、文件編寫方面表現出色,基於深層次上下文實現實時程式碼補全;Luma的模型在創新方面取得重大突破,可將文字和影像轉化為高品質、逼真的影片;Stable Diffusion 3.5是基於SageMaker HyperPod訓練的高階文生圖模型,效能強大。
推出Amazon Bedrock Marketplace,透過該平臺,使用者可以使用領先供應商提供的一百多個新興和專業基礎模型。使用者能夠透過統一介面發現、測試各類新興專業模型,部署模型後,可使用Amazon Bedrock的統一API,以及知識庫、安全防護、Agent等工具,同時享受其安全和隱私保護。
Amazon Bedrock的重大發布
Amazon Bedrock是一項完全託管的服務,藉助高效能基礎模型,構建和擴充套件生成式人AI應用程式。它是構建和擴充套件生成式AI應用的關鍵平臺,為客戶提供將推理功能整合到生產環境所需的工具,已為客戶帶來價值。
此次2024 re:Invent上,Amazon Bedrock有很多重大發布,包括:
Amazon Bedrock推出延遲最佳化選項,基於Amazon EC2 Trn2例項,利用最新硬體和軟體最佳化,可在多模型上實現更好的推理效能。使用者指定推理請求優先順序後,平臺自動處理,該功能已面向特定模型開放預覽,如Llama 405B模型在延遲最佳化版本中效能顯著提升,Anthropic的 Claude 3.5 Haiku模型延遲最佳化版處理速度大幅提高。
Amazon Bedrock推出模型蒸餾功能,使用者只需提供示例提示,平臺自動完成工作,透過蒸餾得到的模型執行速度提升到5倍,成本降低75%,顯著提升生成式AI專案投資回報。
Amazon Bedrock 知識庫支援GraphRAG,利用Amazon Neptune自動生成圖譜,建立資料來源關聯,無需專業知識即可開發更全面的生成式AI應用,清晰展示連線和資訊來源,提升事實驗證透明度,透過API呼叫可讓應用生成更準確響應。
Amazon Bedrock推出自動推理檢查功能,預防模型幻覺引起的事實性錯誤,基於數學驗證檢查模型事實性陳述準確性並展示推理過程,如在保險領域可確保回答準確性。
Amazon Bedrock多智慧體協作功能,支援多個Agent協作處理複雜工作流程,為特定任務建立一系列獨立Agent,建立監督Agent負責設定資訊訪問許可權、決定任務執行方式並確保協作,使用者無需單獨管理Agent,可輕鬆處理複雜任務。
新一代的Amazon SageMaker
Amazon SageMaker重新做了定義,叫新一代的Amazon SageMaker。新一代Amazon SageMaker為資料、分析和AI提供統一平臺,包括以下內容:
全新的Amazon SageMaker Unified Studio使客戶能夠輕鬆查詢和訪問整個組織的資料,並彙集了亞馬遜雲科技專門構建的分析、機器學習(ML)和AI功能,客戶可以在Amazon Q Developer的協助下,為各種型別的常見資料用例選擇最合適的工具處理資料。
Amazon SageMaker Catalog和內建的治理功能確保合適的使用者以正確目的訪問合適的資料、模型和開發元件。
全新的Amazon SageMaker Lakehouse統一了資料湖、資料倉儲、運營資料庫和企業應用程式中的資料,使客戶可以輕鬆訪問和處理Amazon SageMaker Unified Studio中的資料,並使用其熟悉的AI和ML工具或與Apache Iceberg相容的查詢引擎。
全新zero-ETL與領先的軟體即服務(SaaS)應用程式的整合,讓客戶無需複雜的資料管道,即可在Amazon SageMaker Lakehouse和Amazon Redshift中訪問第三方SaaS應用程式的資料,並進行分析或機器學習。
大的方向上,客戶在構建整個生成式AI的旅程時,需要的不只是模型,甚至不只是生成AI這個詞,更多的是資料加AI的統一。新一代Amazon SageMaker就是資料加AI,首先是統一,統一的平臺;第二它要開放,第三還是要安全。我們會透過這三層,給客戶提供從資料到AI的一體化的感受。
以前的Amazon SageMaker,現在叫Amazon SageMaker AI,它也有很多新的功能釋出。Amazon SageMaker AI推出四項創新,助力企業更快使用熱門的公開模型,最大化訓練效率、降低成本,並使用其首選工具加速生成式AI模型的開發:
Amazon SageMaker HyperPod新增三項強大功能(新訓練模板、靈活訓練計劃、任務治理),幫助客戶更輕鬆地快速開始訓練當今最流行的公開可用模型,透過靈活訓練計劃節省數週的模型訓練時間,並最大化計算資源利用率,將成本降低高達40%。
新訓練模板幫助客戶更快上手:Amazon SageMaker HyperPod現在提供30多個精選的模型訓練配方,可適用於時下熱門的一些公開可用模型,包括Llama 3.2 90B、Llama 3.1 405B和Mistral 8x22B。這些配方極大地簡化了客戶的入門過程,自動載入訓練資料集、應用分散式訓練技術,並配置系統以實現高效的檢查點管理和基礎設施故障恢復。
靈活訓練計劃可輕鬆滿足訓練時限和預算要求:客戶只需輕鬆點選幾下,就能指定預算、截止日期和所需的最大計算資源量。Amazon SageMaker HyperPod會自動預留容量、設定叢集並建立模型訓練作業,幫助團隊節省數週的訓練時間,減少客戶在獲取大型計算叢集以完成模型開發任務時的不確定性。
任務治理功能最大化加速器利用率:透過Amazon SageMaker HyperPod任務治理功能,客戶可以在模型訓練、微調和推理過程中最大化加速器的利用率,將模型開發成本降低最多 40%。
這些新功能能夠幫助客戶有更靈活、更經濟地承載客戶在生成式AI訓練和推理的工作負載。
總的來看,新一代Amazon SageMaker提供資料和AI的統一,去應對訓練、推理、MLOps等場景。同Amazon SageMaker AI也有很多新的功能來加強使用者的體驗。
亞馬遜雲科技近幾年的創新,不僅在雲的核心服務層面持續創新,更在從晶片到模型,再到應用的每一個技術堆疊取得突破,讓不同層級的創新相互賦能、協同進化。陳曉建堅信,只有全棧聯動的大規模創新才能真正滿足當今客戶的發展需求。