在生成式 AI 領域,眾多科技巨頭和初創企業的技術落地能力正在吸引關注。近日,亞馬遜雲科技在北京分享了自身在生成式 AI 領域的最新進展。
「從模型能力到真正的運營生產之間,企業還需要增加很多輔助能力,」亞馬遜雲科技大中華區產品部總經理陳曉建在活動中說道。「Amazon Bedrock 提供一系列廣泛的能力,如預置吞吐量功能以保障業務擁有穩定獨享的底層資源,模型微調能夠將自身的業務資料與大模型快速進行結合,以及能夠全面監管大模型的 Guardrails 功能等,這些工程化的能力,是企業在生產環境中一定會需要的。」
生成式 AI 爆發至今已有一年多的時間,在技術突破後,亞馬遜雲科技積極與基礎模型公司進行合作。由於不同行業的場景需求差別很大,沒有一個大模型可以勝任所有場景。基於此,亞馬遜雲科技在生成式 AI 領域為客戶提供了三層架構。
・ 其中最底層是高效能基礎設施,亞馬遜雲科技提供面向 AI 最佳化的基礎算力,包括英偉達最新推出的 GH200 晶片,以及投入大量資源研發的自研晶片,包括用於訓練的 Amazon Trainium,推理晶片 Amazon Inferentia。亞馬遜雲科技也構建了用於訓練和推理的平臺 Amazon Sagemaker。
・ 中間層是基於 Amazon Bedrock 最廣泛的基礎模型選擇,這些模型來自多個領先的提供商,客戶可以在此基礎上進行定製,同時保持自身的資料私有和安全,並與其他在亞馬遜雲科技上的工作負載無縫整合。
・ 最上層的則是應用 GenAI 技術的開箱即用的雲服務。包括生成式 AI 助手 Amazon Q、面向程式設計開發人員的平臺 Amazon CodeWhisperer 等產品,支援不同客戶的業務需求。
透過這三層架構,不論是具有技術基礎的大型科技公司,還是僅有幾人的創業公司,不同的客戶都可以根據需求構建起生成式 AI 能力以支援自身業務。
在該體系中,Amazon Bedrock 因為不斷接入眾多業界知名大模型而經常被人提起。
Amazon Bedrock 是亞馬遜雲科技的一項完全託管服務,提供安全且便捷的方式,讓使用者能夠訪問大量完全託管的基礎模型(FM)。結合其推出的一系列前沿功能,如檢索增強生成(RAG)、Guardrails、模型評估以及 AI 驅動的智慧代理(Agent)等,Amazon Bedrock 旨在幫助使用者打造高效能、低延遲且具成本效益的生成式 AI 應用程式。
由於「沒有一個模型可以適用於所有業務場景」,Amazon Bedrock 旨在提供不同的基礎模型供客戶選擇:其中既有知名的開源模型,如 Stable Diffusion XL、Llama、Mistral 7B 和 Mixtral 8×7B,也有如 Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan 等非開源模型。
Anthropic 是亞馬遜的重點合作伙伴,這家創業公司成立於 2021 年,其推出的 Claude 大模型系列被認為是 GPT-4 的重要競品。亞馬遜與它的合作緊密,在去年 9 月份宣佈了高達 40 億美元的投資。
Claude 大模型的最新第三代在上個月剛剛推出,其分為三個版本,分別是 Haiku、Sonnet、Opus 三款模型,均已經或即將在 Amazon Bedrock 上提供。
Claude 3 的三個體量模型分別適用於不同產品,它們在複雜任務重表現出的理解能力,邏輯性、速度等在業內領先。可以看到, Claude 3 大模型的百萬 token 價格在業內是非常低的。
Anthropic 表示,Claude 3 Opus 擁有人類本科生水平的知識。Claude 3 在(史丹佛 100Q Hard)上準確性明顯提升,減少了錯誤答案和幻覺。
它支援 200k token 的超長文字召回。在大海撈針實驗中擁有良好效能,展示了 AI 可以識別超長內容中的邏輯的能力。
此外,Claude 3 首次帶來了對多模態能力的支援,使用者現在可以上傳照片、圖表、文件和其他型別的非結構化資料,讓 AI 進行分析和解答。
在活動中,亞馬遜雲科技展示了 Claude 3(Sonnet)的一系列能力。如黃仁勳在英偉達 GTC 上 keynote 的解讀和續寫:
在流浪地球中插入一句三體的內容,讓大模型進行識別:
亞馬遜雲科技表示,很快 Claude3 的「超大杯」版本也將登入 Amazon Bedrock。
大模型正在改造應用的多種使用方式,我們正在看見這件事正在發生。在活動中,亞馬遜雲科技表示大模型已被融入到自身業務中,其在電商領域推出了基於生成式 AI 的專業購物助理 Rufus,它能夠基於人的習慣,透過自然語言與客戶進行溝通。
例如,你在購買時需要考慮哪些因素?如果我需要購買一輛腳踏車,那麼在冬天騎車時需要注意什麼,以及可以購買什麼樣的配件等。
新系統在透過自然語言實現與人自然互動的同時,背後還能夠根據亞馬遜電商的龐大知識庫實現準確的問答。透過這個能力,電商能與客戶進行全方位的自然語言溝通。這是一個把大模型技術與核心業務相結合的典型案例。同樣的事,也會很快推廣到更多客戶的業務當中。
在生成式 AI 時代,亞馬遜雲科技一直在做「最後三公里」的支援。
為了更好地利用已有資料基礎,使用技術領先的工具,面對複雜的客戶場景,亞馬遜雲科技提供了本地化的支援團隊,希望與使用者共同尋找場景和解決方案。在生成式 AI 時代,這或許會是技術能夠快速落地的正確方式。
「儘管大模型非常重要,但僅靠大模型對你的生產是遠遠不夠的。企業需要一系列周邊的能力來正確、合理、安全、高效地使用大模型,這就是亞馬遜雲科技一系列產品所提供的價值所在,」陳曉建表示。