自近日獲知自己摘得諾貝爾物理學獎之後,76 歲的人工智慧教父 Geoffrey Hinton 便「閒不住」了。 這不,谷歌首席科學家 Jeff Dean 曬出了自己參加 Hinton 諾貝爾獎派對前與老爺子的合照,以及短時間內可以參加該派對的 Hinton 博士們。
在幾十年研究生涯中,Hinton 培養出了 40 位博士生,其中不乏前 OpenAI 首席科學家 Ilya Sutskever、前蘋果 AI 總監 Ruslan Salakhutdinov 這樣的大牛。 在週二的一次演講中,Hinton 表示自己非常幸運,遇到了很多聰明的學生,他們取得了非常大的成功,有的做出了偉大的成果。其中他為弟子 Ilya「解僱」奧特曼而感到自豪,並認為奧特曼現在更關心利潤而不是安全。他同時呼籲加強對 AI 安全以及由好奇心驅使的基礎研究的支援。
機器之心盤點了自 1987 年以來,Hinton 博士弟子們的研究領域、研究成果以及其他資訊。如有遺漏和錯誤,請在評論區指正。 桃李滿天下Hinton 的博士跨越了近 40 年 Peter Brown(1987)
Peter Brown 現在是文藝復興科技(Renaissance Technologies)的執行長,他也是 Hinton 的第一位博士生,當時 Hinton 還是 CMU 電腦科學教授。 Peter Brown 博士期間主要研究自動語音識別中的聲學建模問題。他曾在 IBM 研究所從事語音識別、機器翻譯和大規模語言模型的研究。 David Ackley(1987)
David Ackley 是新墨西哥大學電腦科學名譽教授,致力於在無限可擴充套件的計算機架構上研究、開發和倡導穩健優先、盡力而為的計算。David Ackley 的工作涉及神經網路、機器學習、進化演算法,以及安全、架構和計算模型的生物學方法。 值得一提的是,Hinton 與 David Ackley 和 Terry Sejnowski 共同發明了玻爾茲曼機。 Mark Derthick(1988)Mark Derthick 自 1995 年開始在卡內基梅隆大學(CMU)任訪問科學家、專案科學家、研究科學家,但目前已經離任。他的研究興趣包括人機資訊互動、互動式資訊視覺化、知識表徵、探索性資料分析等。 Richard Szeliski(1988)
Richard Szeliski 是華盛頓大學電腦科學與工程系兼職教授、ACM Fellow、IEEE Fellow。Szeliski 在計算機視覺貝葉斯方法、基於影像的建模和渲染以及計算攝影領域進行了開創性研究,是計算機視覺領域的大師級人物,他在計算機視覺研究方面有 30 多年的豐富經驗,主攻計算機視覺和計算機圖形學,是 CV 經典教材《計算機視覺:演算法與應用》的作者。 Richard Szeliski 先後任職於 DEC(美國數字裝置公司)、微軟研究院、Facebook、谷歌。1996 年,他在微軟研究院任職期間提出了一種基於運動的全景影像拼接模型,採用 L-M 演算法,透過求影像間的幾何變換關係來進行影像匹配。此方法是影像拼接領域的經典演算法,Richard Szeliski 也因此成為影像拼接領域的奠基人。2017 年,Richard Szeliski 獲得 ICCV 大會頒發的傑出研究獎。 Kevin Lang(1989)
1989 年,Kevin Lang 在 Hinton 的指導下獲得了 CMU 的電腦科學博士學位。根據網上查詢到的有限資料顯示,他的研究興趣包括計算模型、細胞結構、形狀建模以及量子點和細胞自動機、語音識別。 Steven Nowlan(1991)
Steven Nowlan 是 Epsilon 公司決策科學高階副總裁,他曾在 Motorola 工作近 20 年,在移動和基於位置的應用程式、複雜的軟體架構以及研究科學家和軟體開發人員的組合管理方面擁有豐富的經驗,致力於將創新理念轉化為成功的軟體產品和服務。 David Plaut(1991)
David Plaut 是卡內基梅隆大學的心理學教授,致力於使用計算模型並輔以實證研究來研究高階視覺、閱讀和語言以及語義領域正常和無序認知處理的本質。 David Plaut 的建模工作是在神經網路框架內進行的,其中認知過程是透過大量類似神經元的處理單元之間的合作和競爭互動來實現的,以深入瞭解認知過程如何在大腦中實現,以及大腦功能障礙如何導致認知障礙。 Conrad Galland(1992)
Susanna Becker 是麥克馬斯特大學心理學、神經科學和行為學名譽教授。1992 年,她在 Hinton 的指導下獲得多倫多大學博士學位,研究興趣包括記憶、計算神經科學、海馬神經發生、腦機介面和神經反饋。 Richard Zemel(1994)
Richard Zemel 是美國國家科學基金會(NSF)人工智慧和自然智慧研究所(ARNI)主任,研究致力於用少量標籤進行學習,建立強大且可控的機器學習系統,並且該系統可以遷移到各種任務和領域。他還對演算法公平性有著濃厚的興趣。Richard Zemel 還是 NVIDIA 人工智慧先鋒獎的獲得者。 Tony Plate(1994)
Radek Grzeszczuk 是初創公司 SkinBit 聯合創始人,曾在微軟擔任首席軟體工程師主管。他為擴增實境、基於影像的建模、視覺搜尋和計算成像等領域的發展做出了貢獻。 Brian Sallans(2002)
Brian Sallans 是機器學習、軟體開發、移動軟體專家,在奧地利第一儲蓄銀行(Erste Group)任高階資料科學家。 Sageev Oore(2002)
Sageev Oore 是加拿大 CIFAR 人工智慧主席,戴爾豪斯大學電腦科學學院副教授,曾任谷歌大腦訪問研究科學家。 Andrew Brown(2002) Andrew Brown 查詢到的資訊不多,從 Google Scholar 主頁可以看到,他的研究興趣包括機器學習、神經網路、隱馬爾可夫模型、迴圈神經網路。
他的博士畢業論文為《Product Models for Sequences》。論文介紹了一系列新的時序圖模型, 採用的思路是透過大量更簡單模型的密度組合來構建一個複雜的時序密度模型。
論文地址:https://dl.acm.org/doi/abs/10.5555/936308 Alberto Paccanaro(2002)
2014 年,Navdeep Jaitly 在 Hinton 的指導下獲得了多倫多大學機器學習和電腦科學博士學位。畢業以後,他先後任職於 Google Brain(高階研究科學家)、英偉達(傑出研究科學家)、 再次 Google Brain(科學家)、投資管理公司 The D. E. Shaw Group(深度學習負責人、副總裁)以及 2021 年至今蘋果(機器學習研究科學家)。他的研究興趣在於前沿深度學習。 Tijmen Tieleman(2014)
2014 年,Tijmen Tieleman 在 Hinton 的指導下獲得了多倫多大學的深度學習博士學位。2018 年以來,他先後擔任 AI 初創公司 minds.ai 的 CTO、CEO、聯合創始人和首席科學家。他的研究興趣包括具有不尋常成分的多層確定性前饋神經網路以及使用受限玻爾茲曼機的多層神經網路等。 George Dahl(2015)
George Dahl 是美國山景城 Google Brain 團隊的一名研究科學家。2015 年他在 Hinton 的指導下獲得了博士學位,攻讀博士期間,他與其合作者訓練出了第一個成功的自動語音識別深度聲學模型,還領導團隊贏得了 Kaggle 主辦的默克分子活性挑戰賽。他的研究興趣包括深度學習、自然語言處理和統計機器學習。 Yichuan Charlie Tang(2015)
Yichuan Charlie Tang 從事深度學習和統計機器學習領域的工作。2015 年,他在 Hinton 和另一位導師前蘋果 AI 總監 Ruslan Salakhutdinov 的指導下獲得了多倫多大學的機器學習博士學位。他的研究興趣廣泛,包括機器人 / 自主技術應用、計算機視覺、自然語言處理和強化學習。 2017 年 1 月至 2020 年 6 月,他在蘋果先後擔任研究科學家和高階研究科學家。此後他在投資管理公司 The D. E. Shaw Group 擔任機器學習研究副總裁。 Nitish Srivastava(2016)
Nitish Srivastava 的研究興趣包括機器學習、深度網路和人工智慧。他在多倫多大學電腦科學系攻讀博士,導師為 Hinton 和前蘋果 AI 總監 Ruslan Salakhutdinov 的博士,並於 2016 年獲得博士學位。 2017 年 2 月至 2022 年 2 月,他在蘋果先後擔任機器學習工程師和機器學習研究科學家。2022 年至今,他聯合創立了機器人初創公司 Vayu Robotics 並擔任 CTO。 Jimmy Lei Ba
Jimmy Lei Ba 是多倫多大學助理教授。他從本科(2011)、碩士(2014)到博士(2018)都是在多倫多大學完成的,博士期間導師為 Hinton。他的研究興趣涵蓋了 NeurIPS、ICLR 和 ICML 等研究社群的廣泛主題,並對強化學習、自然語言處理和人工智慧感興趣。他是 CIFAR AI 主席,還曾是 2016 年 Facebook 機器學習研究生獎學金獲得者。 Cem Anil(在讀博士生)
Cem Anil 是多倫多大學和 Vector Institute 的在讀博士生,接受 Hinton 和 Roger Grosse(副教授)的指導。他還是 Anthropic 對齊科學團隊的成員。他的工作涉及深度學習和 AI 安全,並對大語言模型的穩健性和泛化性模式感興趣。他同時致力於推導 Scaling law 來預測潛在危險能力的發展。 參考連結:https://www.cs.toronto.edu/~hinton/gradstuphd.html