Mistral AI新模型對標GPT-4,不開源且與微軟合作,網友:忘了初心

机器之心發表於2024-02-27

「歐洲版 OpenAI」的「最強開源大模型」,被微軟收編了。


生成式 AI 領域,又有重量級產品出現。

週一晚間,Mistral AI 正式釋出了「旗艦級」大模型 Mistral Large。與此前的一系列模型不同,這次 Mistral AI 釋出的版本效能更強,體量更大,直接對標 OpenAI 的 GPT-4。而新模型的出現,也伴隨著公司大方向的一次轉型。

隨著 Mistral Large 上線,Mistral AI 推出了名為 Le Chat 的聊天助手(對標 ChatGPT),任何人都可以試試效果。

圖片

試用連結:https://chat.mistral.ai/

此前,Mistral AI 提出的 Mistral-Medium 因為強大的效能、「意外」的開源而名噪一時,目前很多大模型初創企業都已不再對標 Llama 2,而是將 Mistral AI 旗下模型作為直接競爭對手。此次 Mistral Large 的出現,自然迅速吸引了眾人關注。

人們首先關注的是效能,儘管在引數數量上不及 GPT-4,Mistral-Large 在關鍵效能方面卻能與 GPT-4 媲美,可以說是當前業內的前三:

圖片

Mistral Large 的推理準確性優於 Claude 2、Gemini 1.0 Pro、GPT-3.5,支援 32k token 的上下文視窗,支援精確指令,自帶函式呼叫能力。

人們也發現 Mistral Large 的推理速度超過了 GPT-4 和 Gemini Pro。然而優點到此為止。

模型除了增加體量,也需要有相應的資料。在模型釋出後,人們發現它生成的文字有一種 ChatGPT 的既視感。

圖片

如果說為了能趕上業內最先進的 GPT-4,使用 AI 生成的內容進行訓練或許並不是什麼大問題。但 Mistral Large 的出現也給 AI 社群的人們帶來了危機感:它並不是一個開源大模型。

圖片

這次釋出的大模型有跑分,有 API 和應用,就是不像往常一樣有 GitHub 或是下載連結。

有網友發現,新模型釋出後,Mistral AI 官網還悄悄把所有有關開源社群義務的內容全部撤掉了:

圖片

難道以開源起家的 Mistral AI,成立才不足一年,這就要轉向了嗎?

Mistral Large 目前已經能在 Mistral AI 自有平臺 La Plateforme 和微軟 Azure 上使用。除了 Mistral Large 之外,Mistral AI 還發布了新模型 Mistral Small,針對延遲和成本進行了最佳化。Mistral Small 的效能優於 Mixtral 8x7B,並且推理延遲得到了降低,提供了一種開放權重模型和旗艦模型之間的中間方案。

但模型的定價也引發了一些質疑。比如 Mistral Small 的低延遲相比於 Mixtral 8x7B 的提升微乎其微,但輸入貴了 2.8 倍,輸出貴了 8.5 倍:

圖片

如果以商業大模型的標準來看待,Mistral Large 的定價和 GPT-4 相比並不具備優勢,這又該如何吸引客戶呢?

圖片

這位業內人士表示:「如果它的價格是 GPT-4 Turbo 的一半,我會更理解。」

圖片

新的 Mistral AI「大杯」模型,表現如何?

在官方部落格中,Mistral AI 詳細介紹了 Mistral Large 的功能和優勢:

Mistral Large 在多個常用基準測試中取得了優異的成績,使其成為世界上排名第二的可透過 API 普遍使用的模型(僅次於 GPT-4):

圖片

GPT-4、Mistral Large(預訓練)、Claude 2、Gemini Pro 1.0、GPT 3.5 和 LLaMA 2 70B 在 MMLU 上的比較(測量大規模多工語言理解)。

Mistral Large 的優勢如下:

  • Mistral Large 的母語是流利的英語、法語、西班牙語、德語和義大利語,對語法和文化背景有細緻入微的理解;
  • Mistral Large 的 32K Token 上下文視窗允許從大型文件中精確呼叫資訊;
  • 其精確的指令跟隨能力使開發人員能夠設計自己的稽核策略 ——Mistral AI 以此來設定 le Chat 的系統級稽核;
  • Mistral Large 本身就能夠進行函式呼叫。這與在 la Plateforme 上實施的受限輸出模式一起,實現了大規模應用程式開發和技術堆疊現代化。

關於基準測試結果對比,可以參考以下:

推理和知識

Mistral Large 展現出了強大的推理能力。下圖報告了預訓練模型在標準基準上的效能:

圖片

與多個領先 LLM 模型在廣泛常識、推理和知識基準上的表現對比,基準包括 MMLU(測量理解中的大規模多工語言)、HellaSwag(10-shot)、Wino Grande(5-shot)、Arc Challenge(5-shot)、Arc Challenge(25-shot)、TriviaQA(5-shot)和 TruthfulQA。

多語言能力

Mistral Large 具有原生的多語言能力。它在法語、德語、西班牙語和義大利語的 HellaSwag、Arc Challenge 和 MMLU 基準測試中明顯優於 LLaMA 2 70B。

圖片

Mistral Large、Mixtral 8x7B 和 LLaMA 2 70B 在 HellaSwag、Arc Challenge 和 MMLU 上法語、德語、西班牙語和義大利語的比較。

數學和編碼

Mistral Large 在編碼和數學任務中表現出頂尖的效能。下表報告了一系列流行基準的效能,以評估一些頂級 LLM 模型的編碼和數學效能。

圖片

領先 LLM 模型在流行編碼和數學基準上的效能:HumanEval pass@1、MBPP pass@1、Math maj@4、GSM8K maj@8(8-shot)和 GSM8K maj@1(5-shot)。

與微軟合作,行 OpenAI 故事

在釋出 Mistral Large 等模型的同時,Mistral AI 還宣佈了一個訊息:將與微軟合作,在 Azure 上提供自己的模型。

此次合作使 Mistral AI 成為第二家在微軟 Azure 雲端計算平臺上提供商業語言模型的公司。這有助於 Mistral AI 將自己的模型推向市場,也讓 Mistral AI 有機會使用 Azure 的尖端 AI 基礎設施,以加速其下一代大型語言模型的開發和部署。

圖片

這家公司表示,「在 Mistral AI,我們的使命是讓前沿人工智慧無處不在。這就是我們今天宣佈將自己的開放和商業模型引入 Azure 的原因。微軟對我們模型的信任讓我們前進了一步!」

這項為期多年的協議標誌著微軟正在其最大的賭注 OpenAI 之外,努力提供各種人工智慧模型,為其 Azure 雲服務吸引更多客戶。去年 11 月,OpenAI 經歷了 CEO Altman 被解僱(後又重返)的風波。而作為最大的股東,微軟在訊息公佈前 5 到 10 分鐘才從 OpenAI 那裡得到訊息。在這次動盪後,微軟設法在控制 OpenAI 的非營利性董事會中獲得了一個無投票權的觀察員席位。這讓他們對 OpenAI 的內部運作有了更多瞭解,但在重大決策上,微軟依然沒有投票權。

Mistral AI 對路透社表示,作為交易的一部分,微軟將持有該公司少數股權,但未透露細節。

微軟證實了對 Mistral AI 的投資,但表示不持有該公司的股權。這家科技巨頭因向 OpenAI 提供鉅額資金而受到歐洲和美國監管機構的審查。

根據公告,微軟與 Mistral AI 的合作主要集中在三個核心領域:

  • 超算基礎設施:微軟將透過 Azure AI 超級計算基礎設施支援 Mistral AI ,為 Mistral AI 旗艦模型的 AI 訓練和推理工作負載提供一流的效能和規模;
  • 市場推廣:微軟和 Mistral AI 將透過 Azure AI Studio 和 Azure 機器學習模型目錄中的模型即服務(MaaS)向客戶提供 Mistral AI 的高階模型。除 OpenAI 模型外,模型目錄還提供了多種開源和商業模型。
  • 人工智慧研發:微軟和 Mistral AI 將探索為特定客戶訓練特定目的模型的合作。

除了微軟,MistralAI 還一直在與亞馬遜和谷歌合作,分銷自己的模型。一位發言人表示,該公司計劃在未來幾個月內將 Mistral Large 應用於其他雲平臺。

Mistral AI 成立於 2023 年 5 月,由來自 Meta Platforms 和 Alphabet 的幾位前研究人員 ——Arthur Mensch(現任 CEO)、Guillaume Lample 和 Timothee Lacroix 共同創立。成立不到四周,Mistral AI 就獲得了 1.13 億美元 的種子輪融資,估值約為 2.6 億美元。成立半年後,他們在 A 輪融資中籌集了 4.15 億美元,估值飆升至 20 億美元,漲了七倍多。而此時,他們僅有 22 名員工。

圖片

總體來說,Mistral AI 的模型現在有以下幾種獲取方式:

  • Mistral AI 自己的 API:該接入點安全地託管在 Mistral AI 位於歐洲的基礎設施上,使開發人員能夠在各種型號的模型上建立應用和服務。
  • Azure:Mistral Large 可透過 Azure AI Studio 和 Azure Machine Learning 獲取,其使用者體驗與 Mistral AI 的 API 一致。
  • 安全部署:Mistral AI 的部分模型可以部署在使用者自己的環境中,用於對安全性最敏感的用例。

感興趣的讀者可以前去嘗試。

參考內容:
https://mistral.ai/news/mistral-large/
https://azure.microsoft.com/en-us/blog/microsoft-and-mistral-ai-announce-new-partnership-to-accelerate-ai-innovation-and-introduce-mistral-large-first-on-azure/
https://techcrunch.com/2024/02/26/mistral-ai-releases-new-model-to-rival-gpt-4-and-its-own-chat-assistant/
https://www.reuters.com/technology/microsoft-partners-with-openais-french-rival-mistral-2024-02-26/
https://azure.microsoft.com/en-us/blog/microsoft-and-mistral-ai-announce-new-partnership-to-accelerate-ai-innovation-and-introduce-mistral-large-first-on-azure/

相關文章