奧特曼:如果沒有他(Prafulla Dhariwal)的遠見、才華、信念和決心,就不會有 GPT-4o。
「GPT-4o 的誕生離不開 @prafdhar 的遠見、才華、信念和長期以來的堅定決心。正是這些努力(以及許多其他人的工作)促成了我希望會成為計算機使用方式革命的成果。」
在 OpenAI 釋出新一代旗艦生成模型 GPT-4o 後的兩天,OpenAI CEO 奧特曼對參與該專案的其中一位負責人評價道。
緊隨其後,聯合創始人 Greg Brockman 表示:「GPT-4o 是整個團隊努力的結果。特別要感謝 @prafdhar,他堅信能夠構建一個全能模型,並在過去 18 個月裡透過與 OpenAI 的多個團隊展開合作,從而實現了這一目標。」
看到這,估計大家都很好奇,prafdhar 到底是誰,他就是 Omni 團隊負責人 Prafulla Dhariwal,也是 GPT-3、DALL-E 2 共同創造者。Dhariwal 表示「GPT-4o(o 代表 omni)是 Omni 團隊推出的首個模型,也是 OpenAI 首個原生的全多模態模型。這次釋出是整個組織共同努力的結果」。同時,Dhariwal 提到他想特別感謝團隊中一些出色的成員,正是他們讓這個神奇的模型成為可能!
Dhariwal 口中出色的團隊成員到底有誰,整個團隊貢獻者都有哪些,接下來我們將為大家一一揭曉。
Prafulla Dhariwal
Prafulla Dhariwal 是 OpenAI 的一名研究科學家(也是前文奧特曼特別感謝的人),研究方向主要是生成式模型和無監督學習。他在 2017 年加入 OpenAI,至今已有 7 年多的時間。
Prafulla Dhariwal 本科畢業於麻省理工學院。在 MIT,Prafulla Dhariwal 主要學習電腦科學、數學、物理學,並在 MIT 大腦、思維和機器中心擔任本科生研究員。
根據 Google Scholar 顯示,Dhariwal 論文引用次數達到 72200 多次,參與的研究包括 DALL-E 2、DALL-E 3、Glow、Consistency Models 等,都是大家比較熟悉的。
James Betker
James Betker 是 OpenAI 的研究工程師,主要研究影像和音訊的生成式建模。
在加入 OpenAI 之前,James Betker 在 GARMIN 國際航電瑞士有限公司擔任了 12 年的軟體工程師,並曾在谷歌擔任軟體工程師。
Rowan Zellers
Rowan Zellers 是 OpenAI 的研究員,致力於構建透過語言、視覺和聲音理解人類和世界的機器。
Prafulla Dhariwal 表示:「Rowan Zellers 的研究工作讓 GPT-4o 能夠像人類一樣自然地觀看影片。」Rowan Zellers 也是 GPT-4 研究團隊成員之一。
Alexis Conneau
Alexis Conneau 現在為 OpenAI 音訊 AGI 研究負責人。Dhariwal 表示 Conneau 比 OpenAI 的任何人都更早地提出了 HER 的願景,並堅持不懈地執行!
Gabriel Goh
Gabriel Goh 為 OpenAI 機器學習研究員,他對可解釋性、機器學習、資料視覺化和凸最佳化感興趣。曾經參與了 DALL・E 1、DALL・E 3、GPT-4 等的研究。
Ishaan Gulrajani
Ishaan Gulrajani 現在為 OpenAI 機器學習研究者,此前他博士畢業於史丹佛大學,曾經參與過 Alpaca、Stanford alpaca 等的研究。
Alex Nichol
Alex Nichol 在 OpenAI 從事深度學習研究,DALL-E 2 共同創造者,擅長程式碼、人工智慧和 3D 列印。
Li JING
Li JING 是 OpenAI 的研究員,在 GPT-4o 工作中主要進行影像 / 3D 生成方面的研究。
Li JING 也是 DALL・E 3 和 Sora 的研究團隊成員。Li JING 的研究工作致力於幫助人工智慧理解現實世界並創造新的智慧。
Casey Chu
Casey Chu 是 OpenAI 的一名研究員,研究多模態人工智慧系統,參與過 GPT-4、DALL・E 2 的研究。此前,他博士畢業於史丹佛大學。
Mark Chen
中間一位是 Mark Chen
Mark Chen 為 OpenAI 前沿研究主管,5 月 14 日凌晨釋出會現場就有他的身影,Mark Chen 曾參與過 DALL・E、GPT-4 等的研究。
Jiahui Yu
Jiahui Yu 在 OpenAI 領導感知團隊,此前,他在伊利諾伊大學厄巴納 - 香檳分校獲得博士學位。在加入 OpenAI 之前,Jiahui Yu 在谷歌參與的研究包括 Gemini、PaLM 2 等。
Huiwen Chang
Huiwen Chang 於 2023 年加入 OpenAI,此前她在谷歌擔任高階研究科學家,本科畢業於清華大學。
A. Jabri
A. Jabri 為 OpenAI 的技術人員,主要研究領域是用於自監督和無監督學習的可擴充套件目標和架構。此前曾在谷歌 DeepMind 實習。
Christine McLeavey
Christine McLeavey 是 OpenAI 的技術團隊成員,主要進行多模態研究工作。她的研究興趣主要在於音樂生成,她也是 OpenAI 音樂模型 MuseNet 研究團隊成員。
Yu Zhang
Yu Zhang 是 OpenAI 技術團隊成員,曾在 Google DeepMind 擔任了 6 年的研究科學家。
Yu Zhang 本科畢業於上海交通大學電腦科學系,博士畢業於 MIT 電腦科學系。
除了上面提到的這些研究者,OpenAI 官方也放出了完整名單:
完整名單地址:https://openai.com/gpt-4o-contributions/
其中,語言方面的核心貢獻者包括:
多模態核心貢獻者包括:
感興趣的讀者,可以檢視完整名單瞭解更多資訊。