亞馬遜雲科技展示Claude 3大模型能力,生成式AI落地正在加速

李泽南發表於2024-04-08

上週日,亞馬遜雲科技宣佈 Mistral AI 的 Mistral Large 模型在Amazon Bedrock上正式可用。隨著知名 AI 初創公司 Mistral AI、Anthropic 的前沿的大語言模型(LLM)陸續登陸 Amazon Bedrock,人們在構建生成式 AI 應用程式時,已經有了一系列先進模型的選擇。

在生成式 AI 領域,眾多科技巨頭和初創企業的技術落地能力正在吸引關注。近日,亞馬遜雲科技在北京分享了自身在生成式 AI 領域的最新進展。

「從模型能力到真正的運營生產之間,企業還需要增加很多輔助能力,」亞馬遜雲科技大中華區產品部總經理陳曉建在活動中說道。「Amazon Bedrock 提供一系列廣泛的能力,如預置吞吐量功能以保障業務擁有穩定獨享的底層資源,模型微調能夠將自身的業務資料與大模型快速進行結合,以及能夠全面監管大模型的 Guardrails 功能等,這些工程化的能力,是企業在生產環境中一定會需要的。」

生成式 AI 爆發至今已有一年多的時間,在技術突破後,亞馬遜雲科技積極與基礎模型公司進行合作。由於不同行業的場景需求差別很大,沒有一個大模型可以勝任所有場景。基於此,亞馬遜雲科技在生成式 AI 領域為客戶提供了三層架構。

・ 其中最底層是高效能基礎設施,亞馬遜雲科技提供面向 AI 最佳化的基礎算力,包括英偉達最新推出的 GH200 晶片,以及投入大量資源研發的自研晶片,包括用於訓練的 Amazon Trainium,推理晶片 Amazon Inferentia。亞馬遜雲科技也構建了用於訓練和推理的平臺 Amazon Sagemaker。

・ 中間層是基於 Amazon Bedrock 最廣泛的基礎模型選擇,這些模型來自多個領先的提供商,客戶可以在此基礎上進行定製,同時保持自身的資料私有和安全,並與其他在亞馬遜雲科技上的工作負載無縫整合。

・ 最上層的則是應用 GenAI 技術的開箱即用的雲服務。包括生成式 AI 助手 Amazon Q、面向程式設計開發人員的平臺 Amazon CodeWhisperer 等產品,支援不同客戶的業務需求。

透過這三層架構,不論是具有技術基礎的大型科技公司,還是僅有幾人的創業公司,不同的客戶都可以根據需求構建起生成式 AI 能力以支援自身業務。

在該體系中,Amazon Bedrock 因為不斷接入眾多業界知名大模型而經常被人提起。

Amazon Bedrock 是亞馬遜雲科技的一項完全託管服務,提供安全且便捷的方式,讓使用者能夠訪問大量完全託管的基礎模型(FM)。結合其推出的一系列前沿功能,如檢索增強生成(RAG)、Guardrails、模型評估以及 AI 驅動的智慧代理(Agent)等,Amazon Bedrock 旨在幫助使用者打造高效能、低延遲且具成本效益的生成式 AI 應用程式。

由於「沒有一個模型可以適用於所有業務場景」,Amazon Bedrock 旨在提供不同的基礎模型供客戶選擇:其中既有知名的開源模型,如 Stable Diffusion XL、Llama、Mistral 7B 和 Mixtral 8×7B,也有如 Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan 等非開源模型。

Anthropic 是亞馬遜的重點合作伙伴,這家創業公司成立於 2021 年,其推出的 Claude 大模型系列被認為是 GPT-4 的重要競品。亞馬遜與它的合作緊密,在去年 9 月份宣佈了高達 40 億美元的投資。

Claude 大模型的最新第三代在上個月剛剛推出,其分為三個版本,分別是 Haiku、Sonnet、Opus 三款模型,均已經或即將在 Amazon Bedrock 上提供。

Claude 3 的三個體量模型分別適用於不同產品,它們在複雜任務重表現出的理解能力,邏輯性、速度等在業內領先。可以看到, Claude 3 大模型的百萬 token 價格在業內是非常低的。

亞馬遜雲科技展示Claude 3大模型能力,生成式AI落地正在加速

Anthropic 表示,Claude 3 Opus 擁有人類本科生水平的知識。Claude 3 在(史丹佛 100Q Hard)上準確性明顯提升,減少了錯誤答案和幻覺。

它支援 200k token 的超長文字召回。在大海撈針實驗中擁有良好效能,展示了 AI 可以識別超長內容中的邏輯的能力。

此外,Claude 3 首次帶來了對多模態能力的支援,使用者現在可以上傳照片、圖表、文件和其他型別的非結構化資料,讓 AI 進行分析和解答。

在活動中,亞馬遜雲科技展示了 Claude 3(Sonnet)的一系列能力。如黃仁勳在英偉達 GTC 上 keynote 的解讀和續寫:

亞馬遜雲科技展示Claude 3大模型能力,生成式AI落地正在加速

在流浪地球中插入一句三體的內容,讓大模型進行識別:

亞馬遜雲科技展示Claude 3大模型能力,生成式AI落地正在加速Claude 3 也能準確地識別出來。

亞馬遜雲科技表示,很快 Claude3 的「超大杯」版本也將登入 Amazon Bedrock。

大模型正在改造應用的多種使用方式,我們正在看見這件事正在發生。在活動中,亞馬遜雲科技表示大模型已被融入到自身業務中,其在電商領域推出了基於生成式 AI 的專業購物助理 Rufus,它能夠基於人的習慣,透過自然語言與客戶進行溝通。

例如,你在購買時需要考慮哪些因素?如果我需要購買一輛腳踏車,那麼在冬天騎車時需要注意什麼,以及可以購買什麼樣的配件等。

新系統在透過自然語言實現與人自然互動的同時,背後還能夠根據亞馬遜電商的龐大知識庫實現準確的問答。透過這個能力,電商能與客戶進行全方位的自然語言溝通。這是一個把大模型技術與核心業務相結合的典型案例。同樣的事,也會很快推廣到更多客戶的業務當中。

在生成式 AI 時代,亞馬遜雲科技一直在做「最後三公里」的支援。

為了更好地利用已有資料基礎,使用技術領先的工具,面對複雜的客戶場景,亞馬遜雲科技提供了本地化的支援團隊,希望與使用者共同尋找場景和解決方案。在生成式 AI 時代,這或許會是技術能夠快速落地的正確方式。

「儘管大模型非常重要,但僅靠大模型對你的生產是遠遠不夠的。企業需要一系列周邊的能力來正確、合理、安全、高效地使用大模型,這就是亞馬遜雲科技一系列產品所提供的價值所在,」陳曉建表示。

相關文章