《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

DataWhale發表於2019-08-07

關於機器學習的學習資料從經典書籍、免費公開課到開源專案應有盡有,可謂是太豐富啦,給學習者提供了極大的便利。但網上比比皆是的學習資料大部分都是英文材料,這可難倒了英語不好的學習者,單詞不認識,理解不到位。小編不禁想問:就真的就沒辦法了嘛。其實也不盡然,中文還是有一些不錯的學習資料的,像周志華老師的西瓜書,李航老師的統計學習方法等等都是相當經典的學習資料。今天的主角LeeML-Notes也是和一門中文經典影片課程--臺大李宏毅的機器學習相關。

目錄

1.李宏毅機器學習簡介

2.《LeeML-Notes》李宏毅機器學習筆記

3.《LeeML-Notes》學習筆記框架

4.筆記內容細節展示

a. 對梯度下降概念的解析

b. 為什麼需要做特徵縮放

c. 隱形馬爾科夫鏈的應用

5.程式碼呈現

a. 迴歸分析

b. 深度學習

6.作業展示

7.交流互動

8.開源地址

9.配套影片

 1. 李宏毅機器學習簡介

李宏毅老師現任臺灣大學電氣工程助理教授,研究重點是機器學習,特別是深度學習領域。他有一系列公開的機器學習課程影片,在機器學習領域是很多人入門的教材,人氣不輸吳恩達的 Coursera 機器學習課程。

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

李宏毅老師的課程影片包括多種監督學習、無監督學習監督學習等領域,演算法包括簡單的線性迴歸、logistic 迴歸、支援向量機,乃至深度學習中的各類神經網路模型。

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

梯度下降」課程中的 PPT 。對比了不同梯度下曲線的形狀。

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

詞嵌入」課程中的PPT。展示了語義相似詞語在詞嵌入後呈現出的聚集關係。

因為課程中乾貨滿滿,李宏毅老師的課程影片也被稱為中文世界中最好的機器學習影片。李老師以幽默風趣的上課風格讓很多晦澀難懂的機器學習理論變得輕鬆易懂,他將理論知識與有趣的例子結合在課堂上展現,並且對深奧的理論知識逐步推導,保證學習者能夠學習到問題的精髓所在。比如老師會經常用寶可夢來結合很多機器學習演算法。對於想入門機器學習又想看中文講解的人來說絕對是非常推薦的。

但是,考慮到很多機器學習愛好者對於課程筆記的需求,我們不僅僅需要的是教學影片。我們需要一份課程筆記,能夠引領學習者的思路,幫助引導他們進入這個領域。因此,就誕生了這款《LeeML-Notes》李宏毅機器學習筆記。

 2.《LeeML-Notes》李宏毅機器學習筆記

LeeML-Notes 是 Datawhale 開源組織自《機器學習南瓜書》後的又一開源學習專案,由團隊成員王佳旭、金一鳴牽頭,8 名成員歷時半年精心打磨而成,實現了李宏毅老師機器學習課程內容的 100% 復現,並且在此基礎上補充了有助於學習理解的相關資料和內容,對重難點公式進行了補充推導。期間,Datawhale 開源組織打造了《李宏毅老師機器學習》的組隊學習,在眾多學習者共同的努力下,對該內容進行了迭代和補充。下面,讓我們來詳細瞭解下工作詳情吧。

具體準備工作:

  • 2019 年 2 月--2019 年 4 月:筆記整理初級階段,影片 100% 復現

  • 2019 年 4 月--2019 年 6 月:網站搭建,對筆記內容及排版迭代最佳化

  • 2019 年 5 月--2019 年 6 月:組隊學習《李宏毅機器學習》並對內容進行迭代完善

  • 2019 年 7 月:最後內容修正,正式推廣。

下圖為修訂記錄表:

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

 3.《LeeML-Notes》學習筆記框架

3.a 亮點

這份學習筆記具有以下優點:

  • 完全將李宏毅老師的講課內容轉為文字,方便學習者查閱參考。

  • 不僅保留了 PPT 的內容,還根據課程內容補充了一些知識點。

  • 具有完整的程式碼復現資料。

3.b 筆記框架

內容在整體框架上與李宏毅老師的機器學習課程保持一致,主要由監督學習監督學習遷移學習、無監督學習監督學習中的結構化學習以及強化學習構成。建議學習過程中將李宏毅老師的影片和這份資料搭配使用,效果極佳。筆記也和課程影片完全同步。

目錄詳情見下:

  • P1 機器學習介紹

  • P2 為什麼要學習機器學習

  • P3 迴歸

  • P4 迴歸-演示

  • P5 誤差從哪來?

  • P6 梯度下降

  • P7 梯度下降(用 AOE 演示)

  • P8 梯度下降(用 Minecraft 演示)

  • P9 作業 1-PM2.5 預測

  • P10 機率分類模型

  • P11 logistic 迴歸

  • P12 作業 2-贏家還是輸家

  • P13 深度學習簡介

  • P14 反向傳播

  • P15 深度學習初試

  • P16 Keras2.0

  • P17 Keras 演示

  • P18 深度學習技巧

  • P19 Keras 演示 2

  • P20 Tensorflow 實現 Fizz Buzz

  • P21 卷積神經網路

  • P22 為什麼要「深度」學習?

  • P23 監督學習

  • P24 無監督學習-線性降維

  • P25 無監督學習-詞嵌入

  • P26 無監督學習-領域嵌入

  • P27 無監督學習-深度自編碼器

  • P28 無監督學習-深度生成模型 I

  • P29 無監督學習-深度生成模型 II

  • P30 遷移學習

  • P31 支援向量機

  • P32 結構化學習-介紹

  • P33 結構化學習-線性模型

  • P34 結構化學習-結構化支援向量機

  • P35 結構化學習-序列標籤

  • P36 迴圈神經網路 I

  • P37 迴圈神經網路 II

  • P38 整合學習

  • P39 深度強化學習淺析

  • P40 機器學習的下一步

 4. 筆記內容細節展示

4.a 對梯度下降概念的解析

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

在筆記中重新整理PPT內容,並增加了一些註釋。

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

不對影片語音直接轉文字,而是根據內容整理成知識點,方便讀者理解閱讀。

4.b 為什麼需要做特徵縮放

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

對特徵縮放的PPT進行整理記錄。

 4.c 隱形馬爾科夫鏈的應用

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

隱形馬爾科夫鏈在語言模型中的應用。

4.d 利用貼近學生的例題解釋知識點


《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

用演算法對精靈寶可夢(神奇寶貝)進行分類。

 5. 程式碼呈現

程式碼在李宏毅老師提供程式碼的基礎上進行了最佳化,在 python3 上全部除錯透過。

5.a 迴歸分析

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

5.b 深度學習

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

Keras 的基礎模型構建程式碼。

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

用Keras構建深層模型

6. 作業展示

對筆記課程的作業進行了講解與解讀,並且總結了一些需要注意的點,同樣在 python3 上除錯透過。

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

問題描述。

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes


《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

筆記中提供了課程作業的參考答案。

 7. 交流互動

目錄中每一節最後都設定了交流互動區供大家總結學習內容、提出自己的疑問和廣大學習者互動,可以使用 GitHub 登入,方便讀者們交流。

《李宏毅機器學習完整筆記》釋出,Datawhale開源專案LeeML-Notes

  • 8.開源地址:https://github.com/datawhalechina/leeml-notes

  • 9. 配套影片:https://www.bilibili.com/video/av59538266

主要貢獻人員

  • 負責人:王佳旭、金一鳴

  • 成員:黑桃、李威、 排骨、追風者、Summer、楊冰楠

相關文章