大模型進入「實用」時代,亞馬遜雲科技已是Next Level

机器之心發表於2024-05-30

雲端計算領域競爭最激烈的時代,亞馬遜雲科技曾提出,雲端計算的普惠是技術升級帶來的。這個說法換到如今的生成式 AI 時代也是成立的。

如果細數這半年來「震撼釋出」、「顛覆時代」出現的頻率,其實並不比往年低。每一次迭代都在抬高大模型解決問題能力的上限,也都拓寬了人們關於如何利用大模型解決現實場景問題的視野。

前段時間,Claude 3 高調面世,一度打破 GPT-4 保持了許久的全球最強大模型紀錄 。

Claude 3 的背後,站著 Anthropic 的深度合作伙伴 —— 亞馬遜雲科技。經過對 Amazon Bedrock 上的 Claude 3 與微軟 Azure GPT4 相關測試,假定 6:1 的輸入輸出比,Claude 3 Sonnet 成本僅為 GPT4-Turbo 的 37%,Claude 3 Haiku 成本僅為 GPT3.5-Turbo 的 61%。

成本的大幅降低,並不意味著效能方面的犧牲。由於硬體和軟體的最佳化,Amazon Bedrock 上的 Claude 3 模型的實時互動速度顯著加快。此外,透過大規模擴充套件以及新的自監督技術,Claude 3 上下文中複雜問題的準確性預期也提高了 2 倍,這意味著人工智慧更加有用、安全和誠實。

2024 年即將過半,大模型賽道越來越卷,廠商們又該憑藉什麼如何留住使用者?亞馬遜雲科技的秘訣是什麼?

技術進步的同時,使用者的需求也在進化。在亞馬遜雲科技中國峰會上,我們再次看到了這家公司的一系列新思考。

全球 80% 獨角獸的選擇

Amazon Bedrock 有哪些優勢?

在現實場景中,沒有一個模型能適用於所有用例,也不會有一個大模型能「一統天下」。對於那些急需使用大模型重做業務的企業來說,最理想的接入方式是透過一個 API 訪問不同模型,根據自己的業務需求做出最佳選擇。

大模型落地的範圍越廣、程度越深,企業使用者們就越能感受到這一點。

上述需求客觀存在,就是 Amazon Bedrock 保持核心優勢的背景之一。在亞馬遜雲科技的三層生成式 AI 技術棧中,Amazon Bedrock 位於其中的「工具層」。而且與多數提供大模型 API 服務的廠商不同,亞馬遜雲科技起初將 Amazon Bedrock 設計為一位「全能選手」。

圖片

截至目前,Amazon Bedrock 提供的基礎模型數量已經達到了 30 個,且都是來自 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 、Mistral AI 等頂尖的大模型廠商。在功能上,這些基礎模型覆蓋了文字生成、虛擬助手、文字和圖片檢索、文字摘要、圖片生成等;在場景上,覆蓋了翻譯、智慧運營、角色扮演、創意寫作、智慧教輔、智慧辦公、客戶服務、稽核風控、智慧開發、影片 VQA 這十大常見應用,涉及社交、遊戲、電商、零售、教育、製造等多個行業。

可以說,當前最新、最前沿的一批模型,都在 Amazon Bedrock。

圖片

如果大致對比今年 Amazon Bedrock 的上新,可以看出,今年 Amazon Bedrock 的「上新」動作,明顯有著面向企業級負載的特色:

以 Claude 3 為例,該系列包含三個模型,延續了 Claude 系列的傳統強項 —— 長上下文視窗,初始階段即支援 200K Token 上下文視窗。

相比於 Claude 3 Opus 的「最智慧」和 Claude 3 Haiku 的「速度最快、最緊湊」,Claude 3 Sonnet 在智慧程度與執行速度之間實現了理想的平衡。尤其是對於企業工作負載而言,與同類模型相比,Claude 3 Sonnet 以更低的成本提供了強大的效能,並專為大規模 AI 部署中的高耐用性而設計 —— 這對於企業用例來說非常重要。

基於亞馬遜雲科技與 Anthropic「深厚」的合作關係,Amazon Bedrock 成為了第一個提供 Claude 3 Sonnet 託管服務的平臺。後續登陸 Amazon Bedrock 的 Cohere 基礎模型 Command R 和 Command R+ 也都是功能強大且可擴充套件的大型語言模型(LLM),專門為現實世界的企業級工作負載而設計。

Amazon Bedrock 今年還迎來了一位全新的入駐廠商,就是有「歐洲版 OpenAI」之稱的 Mistral AI 。這家公司將旗下最強大的 Mistral Large 釋出到 Amazon Bedrock,Mistral Large 語言理解和生成能力很強,非常適合需要推理能力或高度專門化的複雜任務,如合成文字生成、程式碼生成、檢索增強生成(RAG)或智慧代理。同時,Mistral AI 也承諾亞馬遜雲科技的使用者可以使用和訪問 Mistral AI 未來發布的大模型。

當然,現實場景何其複雜,任何平臺都不能保證自己能夠提供使用者所有所需的大模型,在這個過程中,使用者還需要更高的「靈活度」。

因此,Amazon Bedrock 提供了根據業務需求定製生成式 AI 的功能 ——「自定義模型匯入」

對於已經對 LLM 進行了大量微調或想要從頭開始訓練自定義模型的使用者,這是個很好的選項 。比如,使用者可以將自己在 Amazon SageMaker 或其他工具上的定製模型「搬運」過來,至少 Amazon SageMaker 就提供了超過 250 個預訓練基礎模型,如 Mistral、Llama2、CodeLlama、Jurassic-2、Jamba、pplx-7B、70B 和 Falcon 180B。

在這場峰會上,亞馬遜雲科技還公佈了一個重磅訊息:由百川智慧提供的基礎模型 Baichuan2-7B 即將登陸中國區域 SageMaker JumpStart ,由零一萬物提供的基礎模型 Yi-1.5 6B/9B/34B 正式登陸中國區域 SageMaker JumpStart ,在為中國企業提供豐富模型選擇的同時滿足了企業對安全合規、快速擴充套件、免運維的需求。

圖片

作為首批登陸中國區域 SageMaker JumpStart 的中文基礎模型,Baichuan2 和 Yi-1.5 與亞馬遜雲科技託管服務深度整合,助力中國企業應用一流的生成式 AI 技術實現本土創新與業務轉型。

這意味著使用者可以將自己在更豐富的開源模型架構上構建的自定義模型。隨著本土開源大模型鼎盛時期的到來,未來必將會有更多來自中國大模型企業的基礎模型登陸亞馬遜雲科技的平臺,使用者也能靈活呼叫這些中文能力更強大的模型基座。

大模型落地

目前能在網頁中走完全流程了

提供了各種開源和閉源的模型 API 顯然還不夠,距離將 AI 應用在場景中還很遙遠。

儘管大模型在很多項任務上的表現可以媲美人類,但還不足以直接推動生成式 AI 落地的爆發。經歷了最初的百模大戰,也見過激烈的引數、效能競爭,如今的使用者心態已經進入「不看數字看療效」的階段。

目睹實際挑戰的大模型廠商,過去這段時間也做了一系列探索,期望降低 AI 應用的門檻,提升使用者的實際體驗。

很早就預判到這一趨勢的亞馬遜雲科技,在 Amazon Bedrock 設計之初就貫徹了「一站式服務」的核心理念:簡化選擇、簡化定製、簡化整合。

圖片

亞馬遜全球副總裁、亞馬遜雲科技大中華區總裁儲瑞松。

首先,使用者面臨模型選擇太多的問題,但最好的未必就是最合適的。每家的大模型都各有所長,有的大模型主攻上下文視窗,有的大模型主攻數學推理,使用者也可能想在不同的使用場景調取不同的模型。然而,大模型效能的評估是一項繁重的工作。

Amazon Bedrock 提供的模型評估(Model evaluation on Amazon Bedrock)功能現在已經全面可用,且支援自動評估和人工評估兩種方式,只需點選幾下,使用者就能使用特定資料集和評估指標對大模型進行基準測試和比較,還可以多次嘗試和切換模型,最終選出最匹配需求的模型,極大地簡化了選擇過程。

流程很簡單:首先,選擇要評估的候選模型,可以是公共選項、匯入的自定義模型或微調版本;然後,定義相關的測試任務、資料集和評估指標,如準確性、延遲、成本預測和定性因素;最終,Amazon Bedrock 會提供綜合評估報告。

隨著大模型落地範圍的擴充套件,「安全」已經從一項前瞻議題變為在政策層面被提及的「硬性原則」。前段時間,在以「安全、創新、包容」為議題的「人工智慧首爾峰會」(AI Seoul Summit)上,來自北美、亞洲、歐洲和中東地區的 16 家公司,包括亞馬遜在內,已經就 AI 開發的安全承諾達成一致,並共同簽署了前沿人工智慧安全承諾。

Amazon Bedrock 平臺中,與安全有關的功能設計一早俱備。使用者可以在「Guardrails for Amazon Bedrock」 中根據使用場景設定多種安全隱私控制,如禁止主題、過濾有害內容、遮蔽敏感資訊等,以確保生成式 AI 應用的安全合規執行。大模型進入「實用」時代,亞馬遜雲科技已是Next Level

Amazon Bedrock 的這些關鍵功能,最終都將集合在一個「網頁」之中。就像我們平時會透過 App 點餐、購物,但「小程式」其實也能完成大部分事情。

網頁的名稱是Amazon Bedrock Studio」,這是一種新的基於網頁的生成式 AI 開發體驗,開發者可以使用企業的單點登入憑證(single sign-on)登入。

透過 Amazon Bedrock Studio,開發者可以快速訪問和使用多種基礎模型、Amazon Bedrock Knowledge Bases、Amazon Bedrock Agents、Amazon Bedrock Guardrails 等 Amazon Bedrock 內建服務和工具。

大模型進入「實用」時代

亞馬遜雲科技已是 Next Level

企業需要有技術跟進的能力,但這種能力不需要從零開始構建,已經擁有完整「生成式 AI 技術棧」的亞馬遜雲科技,始終在為希望高效實現智慧化轉型的企業提供助力:

算力的競爭在今年同樣激烈,亞馬遜雲科技的對策是與當前最頂尖的 AI 晶片供應商合作,完成了算力層的全新升級。英偉達 2024 年最新發布的 NVIDIA Blackwell 架構 GPU,第一時間就登陸了亞馬遜雲科技平臺。

與此同時,大模型廠商們發現,人們並不追求複雜的功能和繁瑣的操作,而是更需要簡單、直觀、易用的產品體驗,甚至需要一個「助手」來幫助管理自己的模型和工具。而位於亞馬遜雲科技生成式 AI 技術棧最上層的 Amazon Q 擔任的就是這樣一個角色。具備專業門檻的 Prompt Engineering 終將成為過去,人類不需要親自「對接」大模型。

去年的「百模大戰」彷彿還在眼前,但 2024 年轉眼到來,大模型的競爭已經是 Next Level。在這種轉變中,亞馬遜雲科技「生成式 AI 技術棧」的價值,也被充分驗證。

矽谷著名風險投資家、網景公司創始人馬克・安德森(Marc Andreessen)曾提出 PMF(Product Market Fit)的概念,指出了產品市場匹配度的重要性。實現 Product-Market Fit 意味著產品能夠在市場中獲得成功,因為它滿足了使用者的需求,與競爭對手區分開來,並能夠吸引和保留使用者。

模型或價格只是企業使用者選擇服務的一部分因素,更重要的平臺到底能不能滿足千行百業企業使用者的定製化需求。有了這些,一家大模型服務廠商才能立於不敗之地。

相關文章