伯克利MemGPT團隊創業,要做開源的OpenAI,Jeff Dean也投了

机器之心發表於2024-09-24
他們提供的技術,或許會徹底改變人工智慧行業。

本週一,創業公司 Letta 面世的訊息引發了人們的關注,它提供的技術可以幫助 AI 模型記住使用者和對話。

Letta 成立於加州大學伯克利分校(UC Berkeley)著名的實驗室創業工廠,並已宣佈獲得了由 Felicis 的 Astasia Myers 領投的 1000 萬美元種子資金,本輪估值為 7000 萬美元。

Letta 還得到了人工智慧領域一系列天使投資人的支援,其中包括谷歌的 Jeff Dean、Hugging Face 的 Clem Delangue、Runway 的 Cristóbal Valenzuela 和 Anyscale 的 Robert Nishihara 等。

這家由伯克利博士生 Sarah Wooders 和 Charles Packer 創立的 AI 初創公司備受期待,它是伯克利 Sky Computing Lab 的子公司,也是廣受歡迎的 MemGPT 開源專案的商業實體。

圖片

圖片

GitHub 連結:https://github.com/cpacker/MemGPT

伯克利的 Sky Computing Lab 由著名教授兼 Databricks 聯合創始人 Ion Stoica 領導,是 RISELab 和 AMPLab 的接班人,後兩個實驗室催生了 Anyscale、Databricks 和 SiFive 等公司。尤其是 Sky Lab,它催生了許多流行的開源大型語言模型(LLM)專案,例如 Gorilla LLM、vLLM 和 LLM 結構化語言 SGLang。

「在不到一年時間裡,實驗室很快就誕生了大量專案。他們就是坐在我旁邊的那些人,」Wooders 描述道。「那真是一段不可思議的時光。」

MemGPT 也是這樣一個專案,不過它的熱門程度很高,以至於還沒宣傳就火出圈了。

專案的建立者於 2023 年 10 月 12 日週四釋出了一份白皮書,並計劃在接下來的星期一將更深入的論文和程式碼釋出到 GitHub 上。但有人偶然發現了這篇論文,並於週日將其釋出到 Hacker News 上。Packer 表示,它「在我們有機會正式釋出程式碼、論文或釋出推文介紹之前就在 Hacker News 上火了,」他說。

圖片

專案主頁:https://memgpt.ai/

MemGPT 令人興奮的原因在於 —— 它的目標是解決大語言模型(LLM)的一個痛點:在其原生形式中,像 GPT-4 這樣的模型是無狀態的,這意味著它們不會將歷史資料儲存在長期記憶中。

這對於需要隨著時間推移逐漸瞭解和學習使用者的 AI 應用來說是個大問題 —— 從客戶支援機器人到醫療保健症狀跟蹤應用,很多潛在的 AI 應用需要我們讓大模型擁有「長期記憶」。而 MemGPT 管理資料和記憶體,以便大模型 Agent 和聊天機器人能夠記住以前的使用者和對話。

Packer 回憶說,MemGPT 論文的帖子在 Y Combinator 運營的網站 Hacker News 首頁上停留了 48 小時,他花了幾天時間在網站上回答問題,同時準備釋出程式碼。MemGPT 專案在 GitHub 上釋出後,其連結再次在 Hacker News 上瘋傳。YouTube 上的採訪和教程、Medium 帖子、1.1 萬個星標和 1.2K 個 Fork 迅速湧現。

VC Felicis 的 Myers 也在閱讀有關 MemGPT 的文章時發現了 Wooders 和 Packer,並立即意識到該技術的商業潛力。

「我在論文釋出時就看到了它,」她表示,並立即聯絡了專案團隊。「我們的投資主題是圍繞人工智慧智慧體基礎設施,並且意識到其中一個非常重要的組成部分是資料和記憶體管理,以使這些對話聊天機器人和智慧體有效。」

在找到最先看中他們的那家公司之前,MemGPT 團隊仍然在 Sand Hill Road 四處遊蕩,透過 Zoom 與風投公司進行通話。

與此同時,Stoica 還幫助公司結識了 Jeff Dean、Robert Nishihara 和其他知名的矽谷天使投資人。Packer 回憶說,天使投資的過程異常簡單:「伯克利的許多教授由於在本地工作,所以人脈很廣。他們都很關注這個實驗室即將商業化的專案。」

競爭和 OpenAI o1 的威脅

雖然 MemGPT 去年就已投入使用,但 Letta 的商業版本 Letta Cloud 尚未開放。截至週一,Letta 正在接受測試版使用者的請求。它將提供託管代理服務,允許開發人員在雲平臺上部署和執行有狀態智慧體,可透過 REST API(一種可以維護狀態的程式設計介面)訪問。Letta Cloud 將儲存這樣做所需的長期資料。Letta 還將提供用於構建 AI 智慧體的開發人員工具。

Wooders 看到了 MemGPT 的廣泛用途。「我們看到的頭號用例是高度個性化、非常吸引人的聊天機器人,」她說。但也有前沿用途,如「癌症患者的聊天機器人」,患者上傳他們的病史,然後分享持續的症狀,這樣 AI 就可以學習並隨著時間的推移提供指導。

值得注意的是,MemGPT 並不是唯一一家致力於此的公司。LangChain 可能是其最知名的競爭對手,它已經提供了商業選項。大模型的龍頭公司也在提供智慧體工具,例如 OpenAI 的 Assistants API。

OpenAI 的 o1 新模型可能會讓使用者不再需要修復狀態。由於它是一個多步驟模型,因此它從根本上必須在一定程度上保持狀態,以便在回覆之前「思考」和核實事實。

但 Wooders、Packer 和 Myers 認為 Letta 提供的產品與 OpenAI 存在一些關鍵差異。Letta 聲稱它可以與任何 AI 模型配合使用,並期待其使用者使用其中的許多模型:OpenAI、Anthropic、Mistral 以及他們自研的大模型。OpenAI 的技術目前僅適用於其自身。

更重要的是,Letta 正在使用開源 MemGPT 專案,並堅定地站在開源陣營一邊,並認為開源是 AI 應用的更好選擇。

「我們將自身定位為 OpenAI 的開放替代品,」Packer 說道。「構建最好的 AI 應用是非常困難的事,尤其是當你關心幻覺之類的問題時。」伯克利MemGPT團隊創業,要做開源的OpenAI,Jeff Dean也投了

參考內容:

https://techcrunch.com/2024/09/23/letta-one-of-uc-berkeleys-most-anticipated-ai-startups-has-just-come-out-of-stealth/

相關文章