最豪華大模型創業陣容!OpenAI前CTO組建,翁荔、Schulman等ChatGPT核心成員加盟

机器之心發表於2025-02-19
今天凌晨,一個創業訊息引爆了整個 AI 社群:一家名為 Thinking Machines Lab 的新創業公司建立了,而其背後有一個堪稱有史以來最豪華的大模型創業團隊陣容。
image.png
據該公司的首條推文介紹,Thinking Machines Lab 是一家「人工智慧研究和產品公司。」
image.png
他們還強調這會是一家重視研究開放的公司,其推文中承諾:「我們致力於透過論文發表和程式碼釋出來開放科學,同時會重點關注應用於不同領域的人機協作。我們的方法包括共同設計研究和產品,以便從實際部署和快速迭代中學習。這項工作需要三個核心基礎:SOTA 的模型智慧、高質量的基礎設施和先進的多模態能力。我們致力於構建處於能力領先的模型來兌現這一承諾。」

該公司官方網站對這三核心基礎進行了展開說明

  • 模型智慧是基石。除了強調人機協作和定製之外,模型智慧也至關重要,我們正為科學和程式設計等領域構建前沿能力模型。最終,最先進的模型將解鎖最具變革性的應用和優勢,例如實現新穎的科學發現和工程突破。

  • 基礎設施質量是重中之重。研究生產力至關重要,在很大程度上取決於基礎設施的可靠性、效率和易用性。我們的目標是長期正確地構建事物,以最大限度地提高生產力和安全性,而不是走捷徑。

  • 先進的多模態能力。我們認為多模態對於實現更自然、更高效的通訊、儲存更多資訊、更好地捕捉意圖以及支援與現實環境的更深入整合至關重要。

此外,尤其值得關注是該公司背後的豪華團隊陣容,其中包括多位前 OpenAI 重要成員,如擔任首席科學家的 John Schulman、著名 AI 研究科學家和部落格作家翁荔。
image.png
上述推文中也寫到:「我們是一些最廣泛使用的 AI 產品和軟體背後的科學家、工程師和構建者,包括 ChatGPT、Character.ai、PyTorch 和 Mistral。我們的使命是讓 AI 為您服務,打造一個每個人都能獲得知識和工具的未來,讓 AI 能夠滿足每個人獨特的需求。」

下面我們簡要介紹下 Thinking Machines Lab 背後的這個豪華創業團隊:

Mira Murati(CEO)
image.png
Thinking Machines Lab 的 CEO 為 OpenAI 前 CTO Mira Murati,他曾在 OpenAI 領導過研究、產品與安全方面的工作。去年 9 月,Murati 離開了 OpenAI。

Mira 於 1988 年出生於阿爾巴尼亞,在 2022 年擔任 OpenAI 的技術長。

在學生時代,Mira 就參加過許多奧林匹克競賽和數學競賽。她本科畢業於達特茅斯學院機械工程系,曾在高盛和法國航空航天集團 Zodiac Aerospace 實習。她還在特斯拉工作了三年,擔任特斯拉跨界 SUV Model X 的高階產品經理,在此期間,特斯拉釋出了 Autopilot 的早期版本。

2016 年,Mira 加入 Leap Motion,一家為 PC 製造手部和手指追蹤運動感測器的初創公司,擔任產品和工程副總裁。Mira 在接受外媒 Fast Company 採訪時表示,她希望人類與計算機的互動體驗「像玩球一樣直觀」。

加入 OpenAI 後,Mira 在 ChatGPT、DALL-E、Codex 等的開發中發揮了重要作用。除此以外,今年 5 月份釋出的 GPT-4o 以及本月釋出的 OpenAI o1,都是在 Mira 的領導下完成的。

John Schulman(首席科學家)
image.png
個人主頁:http://joschu.net/

John Schulman 將擔任這家新創業公司的首席科學家。本月初,John Schulman 宣佈辭去 Anthropic 的職務。距離他加入這家人工智慧初創公司,僅僅過去了半年時間。

他是深度強化學習的一位先驅研究者,創造了著名的 PPO 演算法。同時也是 OpenAI 的創始人之一,曾共同領導過 ChatGPT 和 OpenAI 後訓練團隊。

谷歌學術頁面顯示,John Schulman 的學術引用總數已經超過 10 萬。其中,引用量最高的研究便是他創造的 PPO 演算法《Proximal policy optimization algorithms》。

他在加州大學伯克利分校獲得了電腦科學博士學位,導師為該校教授、深度強化學習大牛 Pieter Abbeel。之後從事機器人和強化學習研究與工作。在此之前,他還曾在伯克利短暫學習過神經科學,並在加州理工學院學習過物理學。

Barret Zoph(CTO)
image.png
個人主頁:https://barretzoph.github.io/

擔任這家新創業公司 CTO 的是 Barret Zoph,也曾是 OpenAI 的一位技術主管,領導過 OpenAI 的後訓練團隊,涉及的研究方向包括對齊、工具使用、評估、ChatGPT、搜尋、多模態等等。同時,他還是一位專注投資 AI 公司的天使投資人。

此前,他還曾在谷歌與資訊科學學院擔任過研究科學家,參與訓練了大型稀疏語言模型並將其應用於各種應用的研究工作。

他是兩篇重要論文《Learning transferable architectures for scalable image recognition》和《Neural architecture search with reinforcement learning》的第一作者。

下面按名字首字母排序介紹 Thinking Machines Lab 創始團隊其他成員。

Alex Gartrell
image.png
個人主頁:https://www.alexgartrell.com/

Alex Gartrell 曾任 Meta 伺服器作業系統負責人,Linux 核心、網路和容器化專家。

Alexander Kirillov
image.png
個人主頁:https://alexander-kirillov.github.io/

Alexander Kirillov 將在 Thinking Machines Lab 從事多模態 AI 的研究和開發。他曾參與開發了 OpenAI 高階語音模式和 Meta AI 的 Segment Anything Model(SAM),並曾任 OpenAI 多模態後訓練負責人。

他在德國海德堡大學獲得博士學位,指導老師是 Carsten Rother。

Andrew Tulloch
image.png
個人主頁:https://tullo.ch/

Andrew Tulloch 同樣也曾在 OpenAI 與 Meta 工作過,他的主攻方向是機器學習系統的相關研究與工程開發。

Tulloch 還是一位開源社群的重要參與者,為著名開源專案 PyTorch 和 Caffe 做出過重要貢獻。

Brydon Eastman
image.png
曾在 OpenAI 從事訓練後研究,專攻人類和合成資料、模型對齊和 RL。

Christian Gibson

曾任 OpenAI 基礎設施工程師,專注於訓練前沿模型的超級計算機。

Devendra Chaplot
image.png
Mistral AI 創始團隊成員兼多模態研究主管,Mixtral 和 Pixtral 的共同創始人。VLM、RL 和機器人技術專家。

Ian O'Connell

基礎設施工程,曾就職於 OpenAI、Netflix、Stripe。

Jacob Menick
image.png
ML 研究員,曾領導 OpenAI 的 GPT-4o-mini,之前曾為 ChatGPT 和 DeepMind 的深度生成模型建立做出過貢獻。

Jonathan Lachman

運營主管、前 OpenAI 特別專案負責人和白宮國家安全預算主管。

Joshua Gross
image.png
在 OpenAI 參與構建產品和研究基礎設施,塑造 ChatGPT 的學習系統和 GPU 叢集;此前在 Meta 負責產品基礎設施。

Kurt Shuster
image.png
曾參與 Google DeepMind 的推理、Character.AI 的全棧預訓練和推理以及 Meta AI 的基礎對話研究。

Kyle Luther
image.png
機器學習研究員,此前他在 OpenAI 任職。

(翁荔)Lilian Weng
image.png
曾任 OpenAI 研究(安全)副總裁。

Lilian Weng 是 OpenAI 華人科學家,她 2018 年加入 OpenAI,參與了 GPT-4 專案的預訓練、強化學習 & 對齊、模型安全等方面的工作。她本科畢業於北大,曾前往香港大學進行短期交流,博士畢業於印第安納大學伯明頓分校。

根據領英資料顯示,Lilian Weng 在 OpenAI 已經工作了近 7 年時間,擔任安全研究副總裁一職。2021 年 - 2023 年工作期間,Lilian Weng 建立並領導了應用人工智慧研究團隊,包括產品研究、合作伙伴研究和應用安全,從而使得 OpenAI 的 API 更強大、更實用、更安全。之前,她還是 OpenAI 機器人團隊的技術主管,專注於訓練關於機器人任務的演算法,如教機械手如何解決魔方、旋轉方塊等。

在加入 OpenAI 之前,她還在 Facebook、Dropbox 從事軟體工程和資料科學方面的工作。Google Scholar 顯示,Lilian Weng 論文引用量超過 13000 多次。閒暇時間,Lilian Weng 還寫了一些關於 AI 的部落格文章,她的部落格深入、細緻,具有前瞻性,被很多 AI 研究者視為重要的參考資料

Luke Metz
image.png
Luke Metz 是 OpenAI 創始團隊成員,曾與 John Schulman、Barret Zoph、Liam Fedus 等人在內部共同開發了「low-key research preview」,這是 ChatGPT 的雛形。他也是 o1 推理模型背後的貢獻者之一。

Mario Saltarelli

OpenAI 前 IT 和安全主管。

Myle Ott
image.png
人工智慧研究員,Character.AI 創始團隊成員,Meta 早期 LLM 負責人,FSDP 和 fairseq 的建立者。

Nikki Sommer

曾任 OpenAI 人力資源業務副總裁及 Twitter 人力資源業務總監。

Noah Shpak

ML 工程師。

Pia Santos

執行運營主管,曾在 OpenAI 任職。

Randall Lin

曾在 OpenAI 負責 ChatGPT,並在 X 擔任「Twitter 演算法」的聯合技術負責人。

Rowan Zellers

曾在 OpenAI 工作,從事實時多模態後訓練工作。

Sam Schoenholz
image.png
曾領導 OpenAI 的可信賴擴充套件團隊和 GPT-4o 最佳化。之前曾在 Google Brain 從事統計物理學與機器學習的交叉研究。

Sam Shleifer
image.png
專注於推理的研究工程師,曾就職於 Character.AI、Google DeepMind、FAIR、HuggingFace。

Stephen Chen

Stephen Chen 是在 Meta 工作近十五年的老員工,此前領導人工智慧推理相關研究,負責 Meta 的生成式人工智慧產品和推薦系統。

Stephen Roller
image.png
之前曾在 DeepMind、CharacterAI 和 MetaAI 進行全棧預訓練相關工作。在 Google DeepMind 時,他的研究和工作主要集中在對最大規模語言模型進行預訓練。在 Character.AI 期間,他負責領導預訓練和訓練基礎設施工作。他還曾擔任 Meta 基礎人工智慧研究 (FAIR) 的研究工程師,負責領導大型語言模型和對話團隊(FAIR 的大部分工作都是開源的)。

Yinghai Lu
image.png
Yinghai Lu 曾領導 OpenAI 和 Meta 的各種推理工作,本次離職前是 OpenAI 研究推理團隊的技術負責人。在 2023 年底加入 OpenAI 之前,他是 Facebook AI Infra 的軟體工程師,負責建立推薦推理系統和生成式 AI 模型,參與了 Llama 2 等專案。

他在 2010 年獲得復旦大學電子工程博士學位。畢業後在美國西北大學電子工程系從事博士後研究工作,之後加入灣區的工業界。加入 Thinking Machines Lab 後,他擔任 ML 系統工程師。

相關文章