機器之心報導,參與:李澤南、張倩。
獲得這本實體書最好的方法就是成為貢獻者。
近日,由 Aston Zhang、李沐等人所著圖書《動手學深度學習》放出了線上預覽版,以供讀者自由閱讀。這是一本面向在校學生、工程師和研究人員的互動式深度學習書籍。
GitHub 專案:github.com/diveintodee…
這本書是亞馬遜 MXNet 零基礎深度學習課程的重要組成部分。課程內容推薦使用 Apache MXNet 的前端工具 Gluon 進行開發,可指導你在動手實踐的過程中學會使用簡單易讀的程式碼,寫出產品級的應用。
值得一提的是,該書以 Jupyter 記事本的形式呈現,讀者可以操作其中的程式碼和超引數來獲取及時反饋,以此提高學習效率。
貢獻者
本書的貢獻者包括多位供職於亞馬遜的科學家:
李沐:亞馬遜首席科學家,美國卡內基梅隆大學計算機系博士。
阿斯頓·張:亞馬遜應用科學家,美國伊利諾伊大學香檳分校電腦科學博士。
扎卡里 C. 立頓:亞馬遜應用科學家,美國卡內基梅隆大學助理教授,加州大學聖迭戈分校電腦科學博士。
亞歷山大 J. 斯莫拉:亞馬遜 ML 總監,德國柏林工業大學電腦科學博士。
此外,本書在開源社群還有 100 餘位貢獻者。作者表示,這一線上書「專案」仍然在不斷髮展當中,成為貢獻者將可以獲得專享版贈書,並被致謝。
互動:Jupyter 記事本+活躍的社群支援
每一小節都是可以執行的 Jupyter 記事本,你可以自由修改程式碼和超引數來獲取及時反饋,從而積累深度學習的實戰經驗。
Jupyter 記事本下載地址:zh.diveintodeeplearning.org/d2l-zh.zip
https://v.qq.com/x/page/b13531to52r.html
本書還有活躍的社群支援,可以通過每個章節最後的連結來同社群的數千名小夥伴一起討論學習。
https://v.qq.com/x/page/s13530z3c2m.html
結構:公式 + 圖示 + 程式碼
本書不僅結合文字、公式和圖示來闡明深度學習裡常用的模型和演算法,還提供程式碼來演示如何從零開始實現它們,並使用真實資料來提供一個互動式的學習體驗。
這三種展示方法能相互補充,很多演算法可以通過圖示加深對結構的理解,而如上圖所示的 LSTM 等演算法卻需要公式才能理解具體結構。此外,不論是表示式還是圖例,它們都不能包含完整的細節,很多具體細節不用程式碼是展示不出來的。
目錄
引言
前言
深度學習簡介
如何使用本書
預備知識
獲取和執行本書程式碼
資料操作
自動求梯度
查閱 MXNet 文件
深度學習基礎
線性迴歸
線性迴歸的從零開始實現
線性迴歸的 Gluon 實現
Softmax 迴歸
影象分類資料集(Fashion-MNIST)
Softmax 迴歸的從零開始實現
Softmax 迴歸的 Gluon 實現
多層感知機
多層感知機的從零開始實現
多層感知機的 Gluon 實現
模型選擇、欠擬合和過擬合
權重衰減
丟棄法
正向傳播、反向傳播和計算圖
數值穩定性和模型初始化
實戰 Kaggle 比賽:房價預測
深度學習計算
模型構造
模型引數的訪問、初始化和共享
模型引數的延後初始化
自定義層
讀取和儲存
GPU 計算
卷積神經網路
二維卷積層
填充和步幅
多輸入通道和多輸出通道
池化層
卷積神經網路(LeNet)
深度卷積神經網路(AlexNet)
使用重複元素的網路(VGG)
網路中的網路(NiN)
含並行連結的網路(GoogLeNet)
批量歸一化
殘差網路(ResNet)
稠密連線網路(DenseNet)
迴圈神經網路
語言模型
迴圈神經網路
語言模型資料集(周杰倫專輯歌詞)
迴圈神經網路的從零開始實現
迴圈神經網路的 Gluon 實現
通過時間反向傳播
門控迴圈單元(GRU)
長短期記憶(LSTM)
深度迴圈神經網路
雙向迴圈神經網路
優化演算法
優化與深度學習
梯度下降和隨機梯度下降
小批量隨機梯度下降
動量法
Adagrad
RMSProp
Adadelta
Adam
計算效能
命令式和符號式混合程式設計
非同步計算
自動平行計算
多 GPU 計算
多 GPU 計算的 Gluon 實現
計算機視覺
影象增廣
微調
目標檢測和邊界框
錨框
多尺度目標檢測
目標檢測資料集(皮卡丘)
單發多框檢測(SSD)
區域卷積神經網路(R-CNN)系列
語義分割和資料集
全卷積網路(FCN)
樣式遷移
實戰 Kaggle 比賽:影象分類(CIFAR-10)
實戰 Kaggle 比賽:狗的品種識別 (ImageNet Dogs)
自然語言處理
詞嵌入(word2vec)
近似訓練
Word2vec 的實現
子詞嵌入(fastText)
全域性向量的詞嵌入(GloVe)
求近義詞和類比詞
文字情感分類:使用迴圈神經網路
文字情感分類:使用卷積神經網路(textCNN)
編碼器—解碼器(seq2seq)
束搜尋
注意力機制
機器翻譯
附錄
主要符號一覽
數學基礎
使用 Jupyter 筆記本
使用 AWS 執行程式碼
GPU 購買指南
如何為本書貢獻
gluonbook 包索引
在本書上線之前,李沐等人還推出了《動手學深度學習》系列視訊,這門課程的第一季已經於今年 2 月份結束,共 19 課。李沐博士對此係列視訊進行了整理,有需求的同學可通過以下視訊學習。