OpenAI o1深夜炸場,核心貢獻者有哪些?我們看到了大量華人的名字

机器之心發表於2024-09-13

這篇文章系統梳理了 OpenAI o1模型背後的核心人才。


今天凌晨,OpenAI 震撼釋出 o1 大模型,醞釀已久的「草莓」終於面世。

新模型能夠進行復雜推理,具備真正的通用推理能力,可解決比以往的科學、程式碼和數學模型所能處理的更難的問題。它在一系列高難基準測試中展現出了超強實力,相比 GPT-4o 有巨大提升,甚至能在博士級別的科學問答環節上超越人類專家(詳情請參見《剛剛,OpenAI 震撼釋出 o1 大模型!強化學習突破 LLM 推理極限》)。

雖然 o1 很強,但有趣的是,它並不會嘗試去推理和解答「黎曼猜想」這類人類自己還沒解決的難題,以至於 Andrej Karpathy 忍不住吐嘈說它很懶。
圖片
圖片
對於 o1 模型背後的那些貢獻者來說,這一天可以說非同尋常。在模型正式釋出後,他們終於可以公開談論這一成果。每個人臉上都洋溢著輕鬆的笑容。OpenAI o1深夜炸場,核心貢獻者有哪些?我們看到了大量華人的名字
OpenAI o1 幕後團隊在模型釋出後接受了簡單的採訪,解釋了與 o1 相關的推理的含義、研發過程中的「Aha moment」、用強化學習訓練模型來生成和磨練它自己的思維鏈等內容。

其中,思維鏈提出者 Jason Wei 在第一時間就分享了自己提煉出的經驗和感悟。
圖片
圖片
Jason Wei 提到,OpenAI o1 雖然很強,但能夠激發它潛力的提示卻沒有那麼好寫。因此,針對該模型的提示工程還是一個待研究的問題。
圖片
OpenAI API 文件中提及的提示建議。示例參見:https://platform.openai.com/docs/guides/reasoning/advice-on-prompting

此外,參與該模型安全相關工作的 Lilian Weng(OpenAI 安全系統團隊負責人)也發表了推文,表示 o1 的安全性和穩健性也得到了顯著提升。這表明,「能力和安全並不是兩個相互衝突的目標」。
圖片
在過去的幾年,Lilian Weng 一直以部落格的形式進行高質量的技術分享,幾乎每篇部落格都是精品,被很多 AI 研究者視為重要的參考資料。所以,在她的推文評論區,大家已經在催更了。如果後續有更新,機器之心將第一時間跟蹤報導。
圖片
圖片
OpenAI o1 是一個龐大的專案,背後藏著一支強大的研究團隊,Jason Wei、Lilian Weng 都是其中之一。在一個單獨的部落格中,OpenAI 列出了該專案的所有貢獻者。有意思的是,已經離職的前首席科學家 Ilya 也出現在了核心貢獻者名單中。所以,這個 OpenAI o1 就是 Ilya 所看到的嗎?還是說,他看到了更了不得的東西?
圖片
在這篇文章中,機器之心對 o1 專案的貢獻者名單進行了梳理。

推理研究核心貢獻者

Ahmed El-Kishky

圖片

Ahmed El-Kishky 是 OpenAI 的一名 AI 研究員,他於 2024 年 2 月加入該公司,至今才 8 個月的時間。在此之前,Ahmed 在 X(原名推特)、Meta 等公司任職。他本科畢業於塔爾薩大學、博士畢業於伊利諾伊大學厄巴納 - 香檳分校,導師是韓家煒教授。

Ahmed El-Kishky 主要研究方向包括大規模機器學習,自然語言處理,圖機器學習和推薦系統。

Daniel Selsam
圖片
Daniel Selsam 於 2022 年加入 OpenAI,現在是該公司的一名研究員,曾任職於微軟,還在 DeepMind(現在為谷歌 DeepMind)做過實習生。Daniel Selsam 博士畢業於史丹佛大學,他還是 GPT-4 的貢獻者。

Francis Song
圖片
Francis Song 在 2022 年 6 月加入 OpenAI,至今已經 2 年多了,現在是一名技術人員。在加入 OpenAI 之前,Francis Song 是 DeepMind 的一名研究科學家。此前,他博士畢業於耶魯大學。

Giambattista Parascandolo
圖片
Giambattista Parascandolo 現在是 OpenAI 的一名 AI 研究科學家,目前在 OpenAI 領導一個團隊,專注於解決模型推理問題。他在 2021 年加入 OpenAI,至今已經三年多了。此前,他任職於 DeepMind 等機構。博士畢業於蘇黎世聯邦理工學院。Giambattista Parascandolo 還參與過 GPT-4 的研究。

Hongyu Ren
圖片
Hongyu Ren 在去年 7 月加入,現在是 OpenAI 的一名研究科學家,他還是 GPT-4o 、GPT-4o mini 的核心貢獻者,並致力於 GPT-Next 的研究。Hongyu Ren 本科畢業於北京大學、博士畢業於史丹佛大學。此前,他在蘋果、谷歌、英偉達、微軟等工作過。

Hunter Lightman
圖片
Hunter Lightman 現在是 OpenAI 的一名研究工程師,於 2022 年加入。他本科畢業於賓夕法尼亞大學。

Hyung Won Chung
圖片
Hyung Won Chung 現在是 OpenAI 的一名研究科學家。研究重點是大型語言模型。在那之前,他在谷歌大腦工作,並在 MIT 攻讀博士學位。

他曾參與過一些重要專案的研究工作,比如 5400 億引數的大型語言模型 PaLM 和 1760 億引數的開放式多語言語言模型 BLOOM。機器之心也曾介紹過他為一作的論文《Scaling Instruction-Finetuned Language Models》。

擴充套件閱讀:OpenAI 科學家最新大語言模型演講火了,洞見 LLM 成功的關鍵

Ilge Akkaya
圖片
Ilge Akkaya 在 2019 年加入,現在是 OpenAI 一名工程師,專注於程式合成研究。Akkaya 博士畢業於 UC Berkeley。還參與過 GPT-4 的研究。

Ilya Sutskever
圖片
雖然 Ilya 在今年 5 月離開了 OpenAI,但還是出現在了 o1 的核心貢獻者名單中。幾天前,Ilya 新成立的公司 SSI(安全超級智慧)剛完成 10 億美元的融資,估值達到 50 億美元。關於 Ilya 與 OpenAI 的故事,大家可以參考這篇文章「突發!Ilya Sutskever 成立新公司 SSI,安全超級智慧是唯一目標與產品」,瞭解更多內容。

Jason Wei
圖片
Jason Wei 現在是 OpenAI 一名研究員,於 2023 年 2 月加入。此前,他從 2020 年到 2023 年擔任 Google Brain 的研究科學家。Jason Wei 是思維鏈的提出者,並和 Yi Tay、Jeff Dean 等人合著了關於大模型湧現能力的論文,還參與過 GPT-4 研究。

Jonathan Gordon
圖片
Jonathan Gordon 於 2020 年加入 OpenAI,現在是 OpenAI 的一名研究科學家和團隊負責人,主要研究大型語言模型,還參與過 GPT-4 的研究。此前,Gordon 博士畢業於劍橋大學。

Karl Cobbe
圖片
Karl Cobbe 早在 2018 年就加入 OpenAI,至今已經 6 年多了。他本科畢業於史丹佛大學,主要研究方向是人工智慧和強化學習。曾參與過論文《Let’s Verify Step by Step》,這篇論文作者包括 Ilya Sutskever、John Schulman、Jan Leike 等知名大佬。

Kevin Yu
圖片
Kevin Yu 在 2022 年加入 OpenAI,現在為 OpenAI 一名研究員,他博士畢業於加州大學伯克利分校。

Lukas Kondraciuk
圖片
Lukas Kondraciuk 於 2022 加入 OpenAI,現在是一名研究員。此前,他還任職於谷歌、英偉達。本科和碩士均畢業於華沙大學。還參與過 GPT-4o、GPT-4 的研究。

Max Schwarzer
圖片
Max Schwarzer 於 2023 年 11 月加盟 OpenAI, 致力於提升機器學習系統的能力。他畢業於蒙特利爾大學,曾是約書亞・本希奧(Yoshua Bengio)建立的 Mila 實驗室的博士生,專注於強化學習和自監督學習領域的研究。

Mostafa Rohaninejad
圖片
Mostafa Rohaninejad 在 2023 年 10 月加入了 OpenAI,成為 AI 科學家(AI Scientist)團隊的一員。他是元學習領域知名的 SNAIL 架構的二作,詳情可以參見機器之心此前的報導:入門 | 從零開始,瞭解元學習。他在加州大學伯克利分校獲得了學士和碩士學位。加入 OpenAI 之前,他曾就職於工業機器人公司 Covariant,BAIR 實驗室。同時,他還是一名舉重運動員。

Noam Brown
圖片
Noam Brown 在 2023 年 6 月入職了 OpenAI ,現在是一名專注於多步推理、自我博弈和多智慧體 AI 的研究員。他在今年五月刊發的新論文「The Update-Equivalence Framework for Decision-Time Planning」提出了一種新搜尋方法,解決了模型長路徑搜尋的問題,有人猜測 OpenAI o1 採用了類似方法。

此前,他是 Meta FAIR 的一員,主導了曾火遍一時的 CICERO 專案。這是第一個在策略遊戲《Diplomacy》中達到人類水平表現的 AI,可以參閱機器之心此前的報導:爭取盟友、洞察人心,最新的 Meta 智慧體是個談判高手

隨後,他開發了第一個在無限注德州撲克中擊敗頂尖人類選手的 AI:Libratus 和 Pluribus。Libratus 獲得了馬文・明斯基獎,以表彰其傑出成就。Pluribus 登上了《Science》雜誌封面,併入圍了 2019 年《Science》雜誌年度突破獎。機器之心也曾詳細報導過 Libratus 和 Pluribus。

擴充閱讀:

學界 | Science 論文揭秘:Libratus 如何在雙人無限注德撲中擊敗人類頂級選手
7 papers | 多人德撲 AI、手機 GPU 上的亞毫秒級人臉識別

加入工業界之前,他在卡內基梅隆大學獲得了電腦科學博士學位。更早之前,他就任於聯邦儲備委員會的國際金融市場部門,專注於金融市場中的演算法交易研究。

在推特上,有人懷疑Noam Brown是新模型的領導者,但他澄清說自己不是,並表明該專案是團隊協作的產物。
圖片
Shengjia Zhao
圖片
Shengjia Zhao 於 2022 年 6 月加入,現在是 OpenAI 的一名研究科學家,主攻 ChatGPT。他是 ChatGPT、GPT-4、GPT-4o mini 的作者之一 。他的主要研究方向是大語言模型的訓練和校準。此前,他本科畢業於清華大學,博士畢業於史丹佛大學。

Trapit Bansal
圖片
2022 年,Trapit Bansal 加入 OpenAI 成為了一名研究員,直接對接 Ilya Sutskever。他是馬薩諸塞大學阿默斯特分校的電腦科學博士,主要研究機器學習和自然語言處理。他關於元學習(meta-learning)的研究獲得了 2018 年 ICLR 的最佳論文獎,他的多篇論文也曾入選 EMNLP、ACL Oral。

Vineet Kosaraju
圖片
Vineet Kosaraju 在 2020 年就已加入 OpenAI,是數學生成團隊(Mathgen)的一員。他在史丹佛大學完成了電腦科學的學士和碩士學位,主要研究計算機視覺與自動駕駛技術。他是現在流行的大模型能力測試集 GSM8K 的作者,是大模型可以搜尋網頁併產出回答的 WebGPT 技術的開發者,也是大名鼎鼎的《Let’s Verify Step by Step》論文二作。

Wenda Zhou
圖片
Wenda Zhou 於 2023 年 7 月入職 OpenAI,在此之前,他曾就職於紐約大學等機構。他本科畢業於劍橋,博士畢業於哥倫比亞大學,曾在 NeurIPS、ICLR 等頂會發表多篇論文。

他的研究興趣集中在高維統計學、壓縮感知和深度學習領域。最近,他在探索機器學習在不同情境下的應用,比如資料壓縮和化學。

以上介紹的是基礎貢獻者,完整的「推理研究」部分的名單如下:
圖片
推理技術安全貢獻者

在「推理技術安全」版塊,OpenAI 列出了與新模型相關的貢獻者。除了 Lilian Weng,裡面還有很多其他華人科學家的身影。其中擔任領導職位(o1 Safety Leads 和 Safety Leadership)的包括:

Jieqi Yu

Jieqi Yu 是 OpenAI 的工程經理,2023 年 8 月加入 OpenAI。
圖片
她本科畢業於復旦大學,期間曾在香港科技大學短暫交流,2012 年在美國普林斯頓大學拿到電氣工程博士學位。
圖片
在加入 OpenAI 之前,她在 Facebook 工作了 12 年(包含實習)。
圖片
Kai Xiao

Kai Xiao 是 OpenAI 的機器學習工程師,在麻省理工學院獲得學士學位,隨後獲得電腦科學博士學位。
圖片
他在個人資料中寫道,「我的博士研究主要集中在穩健可靠的機器學習方面。我有興趣瞭解當前機器學習實踐造成的 bias,包括我們對模型架構、訓練演算法和資料集的選擇。此外,我還想開發一些方法,讓模型更穩健地應對這些不必要的 bias。我希望,透過識別和修復這些 bias,機器學習可以為現實世界的部署做好更充分的準備。」
圖片
過去的幾年,他曾在微軟研究院、Deepmind、Citadel、DE Shaw、A9 和 Jane Street 實習,並於 2022 年 9 月加入 OpenAI。
圖片
Lilian Weng

Lilian Weng,中文名翁麗蓮,是 OpenAI 安全系統團隊負責人。
圖片
她本科畢業於北京大學資訊系統與電腦科學專業,曾前往香港大學進行短期交流,之後在印第安納大學布魯明頓分校(Indiana University Bloomington)獲得博士學位。
圖片
她 2018 年加入 OpenAI,參與了 GPT-4 專案的預訓練、強化學習 & 對齊、模型安全等方面的工作。
圖片
正如前面所說,她的部落格深入、細緻,具有前瞻性,被很多 AI 研究者視為重要的參考資料。機器之心報導過的部落格包括:

  • Sora 之後,OpenAI Lilian Weng 親自撰文教你從頭設計影片生成擴散模型
  • OpenAI 安全系統負責人長文梳理:大模型的對抗攻擊與防禦
  • 大模型自主智慧體爆火,OpenAI 也在暗中觀察、發力,這是內部人的分析部落格
  • 為記憶體塞不下 Transformer 犯愁?OpenAI 應用 AI 研究負責人寫了份指南
  • 關於 Prompt Engineering 你該瞭解啥?OpenAI 應用研究負責人幫你梳理了
  • OpenAI Lilian Weng 萬字長文解讀 LLM 幻覺:從理解到克服

「安全」部分的完整名單如下:
圖片
參考連結:https://openai.com/openai-o1-contributions/

相關文章