新火種AI|微軟扶持下一個OpenAI?Mistral AI新模型對標GPT-4,上線即擠爆

xinhuozhong發表於2024-02-27

作者:一號

編輯:美美

OpenAI的大金主微軟,還想締造“下一個OpenAI”。

週一晚間,成立僅9個月的Mistral AI正式釋出了最強力的旗艦模型Mistral Large。和此前他們所推出的一系列模型不同,Mistral AI本次釋出的版本效能更強,體量也更大, 直接對標OpenAI的GPT-4。

在目前所有能夠透過API訪問的大模型中,Mistral Large排名第二,僅次於“當紅明星”GPT-4,並且和GPT-4一樣,是唯二在MMLU考試中拿到了80分以上的。

而且隨著Mistral Large上線,Mistral AI還推出了名為Le Chat的聊天機器人,對標ChatGPT,大有複製OpenAI成功道路的意圖。即便有微軟Azure算力資源的加持,Le Chat的伺服器還是被擠爆了。

忘了初心,開源變閉源?

早在本次Mistral Large“炸街”之前,Mistral AI所提出的Mistral-Medium就因為其強大的效能,還有令人意外的開源而名噪一時。使得不少的大模型初創企業不再對標Llama2這個開源模型,而是轉而將Mistral旗下的模型作為直接競爭對手。 這一次Mistral Large的橫空出世,自然引人注目。

從效能上來說, 儘管Mistral Large在引數量上還比不上GPT-4,但在一些關鍵效能上,它還是能夠和GPT-4一戰的,可以說,已經是當前業內前三的地位。

在推理準確性上,Mistral Large也已經超過了Claude 2、Gemini 1.0 Pro、GPT-3.5等一眾為人所熟知的大模型,並且它還支援32k token的上下文視窗,支援精確指令,自帶函式呼叫能力。在推理速度上,Mistral Large甚至還超過了GPT-4還有谷歌剛推出不久的Gemini Pro。

但有眼尖的網友發現,Mistral修改了網站內容,刪除了所有提及開源社群義務的內容,這讓不少開源大模型愛好者開始擔心,Mistral AI也會像OpenAI一樣,從開放走向封閉。

不過據媒體對Mistral CEO的採訪,未來他們依舊會堅持開源理念,但與此同時,也會推出效能最為強大的閉源模型來參與商業競爭。

從誕生之初,就充滿傳奇光環

誰能想到,今天這個逼近GPT-4的模型,是來自一家僅僅成立9個月的法國公司。

Mistral AI的創始人Arthur Mensch在1993年時出生於法國。在巴黎綜合理工學院和巴黎高等師範學院學習期間,他結識了後來成為Mistral AI聯合創始人的Timothée Lacroix和Guillaume Lample。而後兩位都曾在Meta AI團隊工作過,其中Lample還領導了LLaMA模型的開發。在那時,全球範圍內具備構建、訓練和最佳化大型語言模型(LLM)專業經驗的人才不超過100人。

Arthur Mensch本人也頗有實力。他在2020年初便加入了谷歌,成為了DeepMind的研究員,專注於提高AI和機器學習系統的效率。在那裡,他參與開發了大型語言模型,並以主要作者的身份發表了“Chinchilla論文”,該研究重新定義了人們對AI模型大小、訓練資料量及其效能之間關係的認識。

然而隨著AI競賽的升溫,Mensch對於大公司AI實驗室減少與研究社群分享研究成果的做法感到失望。他所在的團隊從一個10人的小團隊迅速擴大到70人的大團隊,但他覺得在大型科技公司中開發不透明的技術過於官僚化,於是決定離開。

2023年初,他離開了谷歌,和前文所提到的Lacroix和Lample一起創立了Mistral AI。他們的目標是透過更加高效的方法構建和部署AI模型,並堅持開源模型的原則,希望讓每個人對自己使用的AI有更多的控制權。

在種子輪融資時,Mistral AI的故事更具傳奇色彩:一個6人團隊憑藉著7頁PPT就拿到了8億歐元的融資。而當前公司的估值已經達到了20億美元,漲了七倍多。儘管與美國的競爭者相比,所獲得的資金並不算多,但他們的目標是成為 AI領域中最節省資本的公司。

微軟想要打造下一個OpenAI?

在Mistral Large以令人驚喜的效能收穫目光之時,微軟CEO納德拉宣佈,微軟已經和Mistral AI建立了多年合作伙伴關係。這也是微軟繼OpenAI之後,又再一次地把“真金白銀”投給了AI圈的另一家頂流模型公司。

人們不禁懷疑, 微軟這是想要打造“下一個OpenAI”?

根據公告,微軟和Mistral AI的合作將集中在以下三個關鍵領域:

超算基礎結構:微軟將透過Azure AI超算基礎結構支援Mistral AI,用於AI訓練和推理工作負載。

擴充套件市場:微軟和 Mistral AI 將透過 Azure AI Studio 和 Azure 機器學習模型目錄中的模型即服務(MaaS)向客戶提供 Mistral AI 的模型。除 OpenAI 模型外,模型目錄還提供了多種開源和商業模型。

人工智慧研發:微軟和 Mistral AI 將探索為特定客戶訓練特定目的模型的合作。

毫無疑問,除了OpenAI之外,微軟還想給自己的Azure雲服務吸引更多客戶。並且,微軟兩頭下注,實際上很可能是想要分散風險,並且期望獲得更大的影響力。

去年11月,OpenAI經歷了CEO奧特曼被解僱而後又重返的董事會風波。而作為OpenAI的最大股東,微軟直到訊息公佈之前的5到10分鐘才從OpenAI那裡得到訊息。儘管在這場風波之後,微軟設法在控制 OpenAI 的非營利性董事會中獲得了一個無投票權的觀察員席位,這讓他們對OpenAI的內部運作有了更多的瞭解,但在一些重大決策上,微軟依舊沒有投票權。

微軟作為OpenAI的最大金主, 顯然沒在OpenAI的決策上取得與之相對應的影響力。 因此,微軟想要扶持另一家能夠與OpenAI對位的企業也是情理之中。

這一點,在路透社對Mistral AI的採訪中也得到了體現,Mistral AI承認,作為交易的一部分,微軟將持有該公司少數股權,但並沒有透露更多細節。而微軟這邊則僅僅是證實了其對Mistral的投資,在是否持有該公司股權的問題上,微軟給出了否定的回答。而這很可能與微軟因向OpenAI提供了鉅額資金而受到歐洲和美國監管機構的審查有關。

另外,由於Mistral AI是一家法國公司,在語言支援上也更加偏向於歐洲本土語言,因此微軟投資Mistral AI也是想要在歐洲建立起自己的AI影響力,在歐洲AI領域站穩腳跟。

與美國不同,歐洲許多國家對AI的態度偏保守,持批判性看法,尤其是資料保護方面。因此投資一家歐洲本土的AI企業,打造一家“歐洲版OpenAI”,也許能夠更讓人放心。


來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/70035178/viewspace-3007517/,如需轉載,請註明出處,否則將追究法律責任。

相關文章