網傳Ilya Sutskever的推薦清單火了，掌握當前AI 90%

机器之心發表於2024-05-09

原文網址 : https://www.jiqizhixin.com/articles/2024-05-09-7

隨著生成式 AI 模型掀起新一輪 AI 浪潮，越來越多的行業迎來技術變革。許多行業從業者、基礎科學研究者需要快速瞭解 AI 領域發展現狀、掌握必要的基礎知識。

如果有一份「機器學習精煉秘笈」，你認為應該涵蓋哪些知識？

近日，一份網傳 OpenAI 聯合創始人兼首席科學家 Ilya Sutskever 整理的一份機器學習研究文章清單火了。網友稱「Ilya 認為掌握了這些內容，你就瞭解了當前（人工智慧領域） 90% 的重要內容。」

推薦清單：https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE

從研究主題上看，Ilya Sutskever 重點關注 transformer 架構、迴圈神經網路（RNN）、長短期記憶網路（LSTM）、神經網路的複雜度等。

^{推薦清單部分截圖。}

例如，Ilya 推薦谷歌在 2017 年發表的經典論文《Attention Is All You Need》，這是 transformer 架構的問世之作。transformer 架構今天已經成為人工智慧領域的主流基礎架構，特別是它是生成式 AI 模型的核心架構。

Ilya 不僅推薦原論文，還推薦一篇由康奈爾大學副教授 Alexander Rush 等研究者在 2018 年撰寫的部落格文章 ——《The Annotated Transformer》。這篇文章以逐行實現的形式呈現了論文的註釋版本，它重新排序梳理了原論文的內容，並刪除了一些部分，最終展現的是一個完全可用的實現。2022 年 Austin Huang 等研究者又在其基礎上編輯整理出一份採用 PyTorch 實現的更新版部落格。

在 RNN 方面，Ilya 首先推薦閱讀 AI 大牛 Andrej Karpathy2015 年撰寫的一篇部落格，強調「RNN 驚人的有效性」。

Ilya 還推薦了由紐約大學 Wojciech Zaremba（OpenAI創始團隊成員）和 Ilya Sutskever 本人 2015 年發表的論文《Recurrent Neural Network Regularization》。當時，Ilya 還是谷歌大腦的研究科學家。

這篇論文為 RNN 提出了一種簡單的正則化技術，闡述瞭如何正確地將 dropout 應用於 LSTM，大大減少了各種任務的過擬合，包括語言建模、語音識別、影像字幕生成、機器翻譯等等。

此外，Ilya 還推薦了 DeepMind、倫敦大學學院 2018 年聯合發表的論文《Relational recurrent neural networks》。

在 LSTM 方面，Ilya 推薦了 Anthropic 聯合創始人、前 OpenAI 可解釋性團隊技術負責人 Christopher Olah 2015 年撰寫的部落格文章《Understanding LSTM Networks》，這篇文章全面細緻地講解了 LSTM 的基本知識，並闡明 RNN 取得的顯著成果本質上是依靠 LSTM 實現的。

在「複雜度」方面，Ilya 重點推薦了《Kolmogorov Complexity and Algorithmic Randomness》一書中講解「演算法統計」的部分。柯爾莫哥洛夫複雜度為計算理論提供了一個用於探索問題固有複雜度的框架，可幫助研究人員更好地設計和評估 AI 模型。

在這份推薦清單中，我們還看到了一些著名 AI 學者的經典論文。例如，2012 年 ImageNet 影像識別大賽中圖靈獎得主 Geoffrey Hinton 組的論文《ImageNet Classification with Deep Convolutional Neural Networks》，這篇論文提出了 AlexNet，引入了全新的深層結構和 dropout 方法，顛覆了影像識別領域，甚至被認為開啟了深度學習革命。Ilya 也是這篇論文的三位作者之一。

還有 2014 年，DeepMind Alex Graves 等人提出的神經圖靈機（NTM）。NTM 將神經網路的模糊模式匹配能力與可程式設計計算機的演算法能力相結合，具有 LSTM 網路控制器的 NTM 可以從輸入和輸出示例中推斷出簡單的演算法，例如複製，排序等。

此外，Ilya 還推薦了神經網路應用於基礎科學（化學）的研究論文、擴充套件定律相關文章等等，並推薦了史丹佛大學電腦科學課程 CS231n：用於視覺識別的卷積神經網路。

感興趣的讀者可以檢視原推薦清單，瞭解更多內容。

^{參考連結：https://twitter.com/keshavchan/status/1787861946173186062}

推薦一個清單工具
2018-08-14
推薦一個由 AI 生成 LOGO 的網站
2019-03-03
AIGo網站
電腦配置推薦：從入門到高階的組裝電腦主機配置推薦清單大全
2018-10-10
入門推薦系統，你不應該錯過的知識清單
2019-01-15
國內ai推薦
2024-05-24
AI
Ilya Sutskever在NeurIPS炸裂宣判：預訓練將結束，資料壓榨到頭了（全文+影片）
2024-12-14
突發！Ilya Sutskever成立新公司SSI，安全超級智慧是唯一目標與產品
2024-06-20
博文推薦｜傳智教育 x Pulsar：網際網路教育的未來
2021-11-19
單職業版本傳奇推薦 2022復古戰士傳奇手遊
2022-10-31
適合孩子觀看的十部優國產兒童動畫推薦清單！
2020-12-25
動畫
Flutter實戰 | 從 0 搭建「網易雲音樂」APP（三、每日推薦、推薦歌單）
2019-10-16
FlutterAPP
Nature推薦的大模型，現如今最好用的AI工具應當更好地助力科學研究
2025-02-19
大模型AI
VSCode 前端擴展插件推薦
2020-12-28
VSCode
「乾貨」微軟亞洲研究院推薦的計算機視覺專案清單
2019-08-20
微軟計算機視覺
9款AI女友應用推薦
2024-03-24
AI
"探索未來智慧：AI技術一網打盡！"（推薦收藏）
2024-03-10
AI
推薦下我的內網穿透
2020-04-29
內網穿透
推薦一個好用的網站
2020-05-03
網站
90後美女學霸傳奇人生：出身清華姚班，成史丹佛AI實驗室負責人高徒
2019-02-28
AI
Inte十二代酷睿CPU搭配RTX3070Ti顯示卡的電腦配置清單推薦
2022-05-12
2021 書單推薦 | 15 本高分 AI 書籍，統統免費讀
2021-01-05
AI
MySQL實現當前資料表的所有時間都增加或減少指定的時間間隔(推薦)
2021-09-09
MySql
今天推薦，今年排名前 15 的 Vue 後臺管理模板
2021-10-21
Vue
TensorFlow教程和文章推薦大全 -DZone AI
2019-11-14
AI
清風團隊強烈推薦幸運飛艇22266679
2019-06-04
足球推薦最準確網站免費足球分析推薦
2022-11-19
網站
網易雲音樂推薦系統簡單實現系列
2019-03-04
陶哲軒力薦、親自把關：AI for Math照這個清單學就對了
2024-04-16
AI
查詢前90%的資料值
2018-06-30
Java工程師核心書單推薦
2021-03-14
Java工程師
神經網路前向和後向傳播推導（一）：概覽
2022-06-06
神經網路
史上最簡單的推薦系統設計
2019-05-11
《神經網路的梯度推導與程式碼驗證》之CNN的前向傳播和反向梯度推導
2020-09-03
神經網路梯度CNN
《神經網路的梯度推導與程式碼驗證》之LSTM的前向傳播和反向梯度推導
2020-09-07
神經網路梯度
某微信公眾號AI文章清單
2019-06-20
AI
網站相關圖書推薦
2018-03-11
網站
[譯] 除錯神經網路的清單
2019-03-26
除錯神經網路
簡單實現Laravel獲取當前執行的SQL
2020-12-21
LaravelSQL