毋庸置疑,在追加投資27.5億美元之後,亞馬遜雲科技完成了對Anthropic總共40億美元投資,拿到了生成式AI領域的全球頂級船票。這也是2024年生成式AI的關鍵性事件之一。

在近期的2024亞馬遜雲科技生成式AI媒體溝通會,亞馬遜雲科技大中華區產品部總經理陳曉建介紹了亞馬遜雲科技在生成式AI領域的最新進展。相關的進度。陳曉建表示,亞馬遜雲科技與Anthropic的合作是非常緊密,Anthropic推出下一代模型Claude3的時候,第一時間在Amazon Bedrock平臺上完成了釋出。同時,Anthropic做出長期承諾,將透過Amazon Bedrock為世界各地的亞馬遜雲科技的客戶提供訪問其下一代基礎模型的能力。

沒有一個基礎模型能適用所有業務場景

亞馬遜雲科技在生成式AI領域為客戶提供了三層架構。

最底層,亞馬遜雲科技為客戶提供了基礎算力,包括英偉達最新推出的G200晶片,亞馬遜自研晶片Amazon Trainium、Amazon Inferentia以及用於訓練和推理的平臺Amazon Sagemaker。

中間層,以Amazon Bedrock為代表,透過一個模型平臺支援多種技術大模型。Amazon Bedrock提供各種領先的基礎模型供客戶選擇:既有知名的開源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開源模型。

最上層,應用GenAI技術的開箱即用的雲服務。例如Amazon Q,可以與、Amazon QuickSight、Amazon Connect、Amazon CodeWhisperer等應用都實現了非常有效地結合。

與Anthropic在生成式AI領域進行廣泛的深度合作

Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最領先的大模型之一,共包含三個模型:具有幾乎即時響應能力且最緊湊的 Claude 3 Haiku;在技能與速度之間達到理想平衡的 Claude 3 Sonnet;以及為處理高度複雜任務設計的最智慧模型 Claude 3 Opus。客戶可以根據自己的商業需求,從中選擇最合適的智慧、速度和價格組合。

Claude 3的能力已經非常突出,包括四個方面:

1.Claude 3創造模型智慧水平的新紀錄——在數學問題、程式設計練習和科學推理等標準評估中超越了所有現有模型。客戶可以藉助AI驅動的響應,自動化完成任務並保證高準確率,特別是Claude 3 Opus,它不僅在大多數常見的AI系統評估基準測試中表現優異並且在複雜任務中表現出優秀的理解能力和流暢性,走在通用智慧的最前沿。

2.Claude 3現已具備多模態能力——Claude 3可以接收基於影像的輸入,能力與其他前沿模型大致相同,並且延遲低於其他多模態模型(尤其是Claude 3 Haiku)。

3.Claude 3能夠降低幻覺,提升回答準確率——在處理挑戰性開放問題(100Q Hard)上準確性明顯提升,並且減少錯誤答案。

4.Claude 3系列模型均提供200K 超長上下文準確召回,針對某些特殊場景,會開放支援 1M token的上下文視窗;大海撈針(Needle In A Haystack, NIAH) 召回率表現優異;甚至還能識別出測試本身的侷限,比如發現某“目標”句子明顯是後來人為新增進原始文字的。

Claude 3應用場景包括內容續寫、程式碼輔助、電商商品描述撰寫、長文字知識召回總結等。

在活動現場互動時,Claude 3對於隨機提出的相對論問題及中國古代丹法流派伍柳派相關問題均快速得出邏輯清晰的答案。

亞馬遜雲科技如何平衡模型能力和客戶成本

亞馬遜雲科技之所以推出Amazon Bedrock這樣的產品,是因為它為客戶提供了豐富的選擇,客戶可以在自己的應用場景下,選擇成本和效能更合適的環境。

陳曉建也列舉出客戶的疑問:既然Claude 3如此強大,為什麼要加Amazon Bedrock這麼一層呢?

在陳曉建看來,模型能力和真正的運營生產之間,需要增加很多輔助能力。Amazon Bedrock提供一系列除了大模型以外的能力。

首先是Provisioned Throughput(預置吞吐量)。客戶可以購買後臺資源,這些資源提供的大模型能力完全獨享。

其次,是模型微調(fine-tunning),很多客戶都會關注如何將自身的業務資料與大模型結合,進行微調。這毫無疑問是業務能夠產生差異化價值的關鍵,關鍵在於如何用好業務資料,而非僅僅簡單使用完全標準化的大模型。這個能力也是Amazon Bedrock提供的一個關鍵能力。

此外,還有類似Guardrails的能力,能夠全面監管大模型使用情況,透過適當的配置來降低幻覺現象的產生,同時提供全方位日誌。

從使用者角度來看,除了大模型之外,如果他們需要充分利用大模型的能力,那麼應該如何與業務結合呢?陳曉建認為需要一個非常強的資料基礎或者稱之為資料底座。要使用大模型,必須有一定的生產結合。生產結合意味著需要擁有大量的業務資料,需要去與大模型打通。

陳曉建表示,“大模型非常重要,非常核心,然而僅靠大模型對你的生產是遠遠不夠的。你需要一系列周邊能力幫助你正確、合理、安全、高效地使用大模型。這就是亞馬遜雲科技一系列產品所提供的價值所在。”