教授何愷明在MIT的第一堂課

机器之心發表於2024-03-11

700 座的大教室,相比去年增加一倍容量,仍然座無虛席:

教授何愷明在MIT的第一堂課

這就是麻省理工學院(MIT)計算機視覺課《Advances in Computer Vision》6.8300 在 2024 新學期的盛況。

今年是四位教授,每人負責一部分課程:

圖片

課程資訊:https://advances-in-vision.github.io/index.html

有網友評論說,能選上這課的學生太幸運了,每節都是計算機視覺頂會 CVPR Oral 的體驗。

圖片

對於很多人來說,其中最為期待的自然是新晉教授何愷明的課。

MIT 電氣工程與電腦科學系副教授何愷明(Kaiming He)在 3 月 7 日走上講臺上完成了自己「人生中教的第一堂課」。

圖片

據參與現場的同學表示,大家在上課與下課時分別給他獻上了很長一段掌聲。

第一堂課講了什麼呢?

作為麻省理工學院(MIT)電氣工程與電腦科學系(EECS)副教授,何愷明第一節課講授了卷積神經網路的基本知識。

圖片

整堂課分為 4 個部分,包括卷積基本概念、卷積神經網路概念、經典卷積神經網路分析(LeNet、AlexNet、VGG)、視覺化。

圖片

完整課件連結:https://drive.google.com/file/d/1TIhzYkyMJTUMKq3SCzzzzJ2TcUnDIuaM/view

這堂課之所以如此火爆,一個重要的原因是何愷明是一位卓越的科研學者,是我們耳熟能詳的 AI 科學家之一,在計算機視覺領域沒有人不知道他的大名。

從高考狀元到頂尖 AI 科學家

2003 年,何愷明以標準分 900 分獲得廣東省高考總分第一,被清華大學物理系基礎科學班錄取。在清華物理系基礎科學班畢業後,他進入香港中文大學多媒體實驗室攻讀博士學位,師從湯曉鷗何愷明曾於 2007 年進入微軟亞洲研究院視覺計算組實習,實習導師為孫劍博士。

2011 年博士畢業後,何愷明加入微軟亞洲研究院工作任研究員。2016 年,何愷明加入 Facebook 人工智慧實驗室,任研究科學家。

何愷明的研究曾數次得獎。2009 年,湯曉鷗教授、孫劍博士和當時博士研究生在讀的何愷明共同完成的論文《基於暗原色的單一影像去霧技術》拿到了國際計算機視覺頂會 CVPR 的最佳論文獎。

2016 年,何愷明憑藉 ResNet 再獲 CVPR 最佳論文獎,此外,他還有一篇論文進入了 CVPR2021 最佳論文的候選。何愷明還因為 Mask R-CNN 獲得過 ICCV 2017 的最佳論文(Marr Prize),同時也參與了當年最佳學生論文的研究。

根據 Google Scholar 的統計,何愷明一共發表了 74 篇論文,H Index 資料為 68。截至今天,何愷明的研究引用次數超過 53 萬次,並且每年以超過 10 萬次的速度增長。

圖片

這是個什麼量級呢?簡而言之,他加入 MIT 之後立刻成為該校論文引用量最高的學者,不限學科,沒有之一。

那些年,愷明發表過的「神作」

說起愷明大神的作品,最有名的就是 ResNet 了。這篇論文發表於八年前,迄今引用已經超過 20 萬。

圖片

《Deep Residual Learning for Image Recognition》在 2016 年拿下了計算機視覺頂級會議 CVPR 的最佳論文獎。該論文的四位作者何愷明、張祥雨、任少卿孫劍如今在人工智慧領域裡都是響噹噹的名字,當時他們都是微軟亞洲研究院的一員。

圖片

同樣是大神級別的學者李沐曾經說過,假設你在使用卷積神經網路,有一半的可能性就是在使用 ResNet 或它的變種。

何愷明有關殘差網路(ResNet)的論文解決了深度網路的梯度傳遞問題。這篇論文是 2019 年、2020 年和 2021 年 Google Scholar Metrics 中所有研究領域被引用次數最多的論文,並建立了現代深度學習模型的基本組成部分(例如在 Transformers、AlphaGo Zero、AlphaFold 中) )。

如今大模型都在使用的 transformer 的編碼器和解碼器,裡面都有源自 ResNet 的殘差連結。

2021 年 11 月,何愷明以一作身份發表論文《Masked Autoencoders Are Scalable Vision Learners》,提出了一種泛化效能良好的計算機視覺識別模型,同樣是剛剛發表就成為了計算機視覺圈的熱門話題。

圖片

一個初入 AI 領域的新人,在探索的過程中看到很多重要研究主要作者都是何愷明,經常會不由得感到驚訝。何愷明雖然長期身處業界,但科研態度一直被視為標杆 —— 他每年只產出少量一作文章,但一定會是重量級的,幾乎沒有例外。

我們也經常讚歎於何愷明工作的風格:即使是具有開創性的論文,其內容經常也是簡明易讀的,他會使用最直觀的方式解釋自己「簡單」的想法,不使用 trick,也沒有不必要的證明。這或許也將成為他在教學領域獨特的優勢。

參考內容:

https://twitter.com/sarameghanbeery/status/1757101096844288310

相關文章