18個月,OpenAI這支團隊搞出了GPT-4o

机器之心發表於2024-05-16
奧特曼:如果沒有他(Prafulla Dhariwal)的遠見、才華、信念和決心,就不會有 GPT-4o。

「GPT-4o 的誕生離不開 @prafdhar 的遠見、才華、信念和長期以來的堅定決心。正是這些努力(以及許多其他人的工作)促成了我希望會成為計算機使用方式革命的成果。」

在 OpenAI 釋出新一代旗艦生成模型 GPT-4o 後的兩天,OpenAI CEO 奧特曼對參與該專案的其中一位負責人評價道。

圖片

緊隨其後,聯合創始人 Greg Brockman 表示:「GPT-4o 是整個團隊努力的結果。特別要感謝 @prafdhar,他堅信能夠構建一個全能模型,並在過去 18 個月裡透過與 OpenAI 的多個團隊展開合作,從而實現了這一目標。」

圖片

看到這,估計大家都很好奇,prafdhar 到底是誰,他就是 Omni 團隊負責人 Prafulla Dhariwal,也是 GPT-3、DALL-E 2 共同創造者。Dhariwal 表示「GPT-4o(o 代表 omni)是 Omni 團隊推出的首個模型,也是 OpenAI 首個原生的全多模態模型。這次釋出是整個組織共同努力的結果」。同時,Dhariwal 提到他想特別感謝團隊中一些出色的成員,正是他們讓這個神奇的模型成為可能!

圖片

Dhariwal 口中出色的團隊成員到底有誰,整個團隊貢獻者都有哪些,接下來我們將為大家一一揭曉。

Prafulla Dhariwal

圖片

Prafulla Dhariwal 是 OpenAI 的一名研究科學家(也是前文奧特曼特別感謝的人),研究方向主要是生成式模型和無監督學習。他在 2017 年加入 OpenAI,至今已有 7 年多的時間。

Prafulla Dhariwal 本科畢業於麻省理工學院。在 MIT,Prafulla Dhariwal 主要學習電腦科學、數學、物理學,並在 MIT 大腦、思維和機器中心擔任本科生研究員。

根據 Google Scholar 顯示,Dhariwal 論文引用次數達到 72200 多次,參與的研究包括 DALL-E 2、DALL-E 3、Glow、Consistency Models 等,都是大家比較熟悉的。

圖片

James Betker

圖片

James Betker 是 OpenAI 的研究工程師,主要研究影像和音訊的生成式建模。

在加入 OpenAI 之前,James Betker 在 GARMIN 國際航電瑞士有限公司擔任了 12 年的軟體工程師,並曾在谷歌擔任軟體工程師。

Rowan Zellers

圖片

Rowan Zellers 是 OpenAI 的研究員,致力於構建透過語言、視覺和聲音理解人類和世界的機器。

Prafulla Dhariwal 表示:「Rowan Zellers 的研究工作讓 GPT-4o 能夠像人類一樣自然地觀看影片。」Rowan Zellers 也是 GPT-4 研究團隊成員之一。

Alexis Conneau

圖片

Alexis Conneau 現在為 OpenAI 音訊 AGI 研究負責人。Dhariwal 表示 Conneau 比 OpenAI 的任何人都更早地提出了 HER 的願景,並堅持不懈地執行!

Gabriel Goh

圖片

Gabriel Goh 為 OpenAI 機器學習研究員,他對可解釋性、機器學習資料視覺化凸最佳化感興趣。曾經參與了 DALL・E 1、DALL・E 3、GPT-4 等的研究。

Ishaan Gulrajani圖片

Ishaan Gulrajani 現在為 OpenAI 機器學習研究者,此前他博士畢業於史丹佛大學,曾經參與過 Alpaca、Stanford alpaca 等的研究。

Alex Nichol圖片

Alex Nichol 在 OpenAI 從事深度學習研究,DALL-E 2 共同創造者,擅長程式碼、人工智慧和 3D 列印。

Li JING

圖片

Li JING 是 OpenAI 的研究員,在 GPT-4o 工作中主要進行影像 / 3D 生成方面的研究。

Li JING 也是 DALL・E 3 和 Sora 的研究團隊成員。Li JING 的研究工作致力於幫助人工智慧理解現實世界並創造新的智慧。

Casey Chu

圖片

Casey Chu 是 OpenAI 的一名研究員,研究多模態人工智慧系統,參與過 GPT-4、DALL・E 2 的研究。此前,他博士畢業於史丹佛大學。

Mark Chen

圖片

中間一位是 Mark Chen

Mark Chen 為 OpenAI 前沿研究主管,5 月 14 日凌晨釋出會現場就有他的身影,Mark Chen 曾參與過 DALL・E、GPT-4 等的研究。

Jiahui Yu

圖片

Jiahui Yu 在 OpenAI 領導感知團隊,此前,他在伊利諾伊大學厄巴納 - 香檳分校獲得博士學位。在加入 OpenAI 之前,Jiahui Yu 在谷歌參與的研究包括 Gemini、PaLM 2 等。

Huiwen Chang

圖片

Huiwen Chang 於 2023 年加入 OpenAI,此前她在谷歌擔任高階研究科學家,本科畢業於清華大學

A. Jabri

圖片

A. Jabri 為 OpenAI 的技術人員,主要研究領域是用於自監督和無監督學習的可擴充套件目標和架構。此前曾在谷歌 DeepMind 實習。

Christine McLeavey

圖片

Christine McLeavey 是 OpenAI 的技術團隊成員,主要進行多模態研究工作。她的研究興趣主要在於音樂生成,她也是 OpenAI 音樂模型 MuseNet 研究團隊成員。

Yu Zhang

圖片

Yu Zhang 是 OpenAI 技術團隊成員,曾在 Google DeepMind 擔任了 6 年的研究科學家。

Yu Zhang 本科畢業於上海交通大學電腦科學系,博士畢業於 MIT 電腦科學系。

除了上面提到的這些研究者,OpenAI 官方也放出了完整名單:

圖片

完整名單地址:https://openai.com/gpt-4o-contributions/

其中,語言方面的核心貢獻者包括:

圖片

多模態核心貢獻者包括:

圖片

感興趣的讀者,可以檢視完整名單瞭解更多資訊。

相關文章