留給人類的時間不多了?現在不學機器學習更待何時!

機器學習演算法與Python學習發表於2017-11-17

微信公眾號

關鍵字全網搜尋最新排名

【機器學習演算法】:排名第一

【機器學習】:排名第一

【Python】:排名第三

【演算法】:排名第四

立即參團

原價 ¥899.00

目前已達最低價 ¥399.00

>>點選文末閱讀原文參團<<

?wxfrom=5&wx_lazy=1

機器學習(升級版


課程目標:本課程特點是從數學層面推導最經典的機器學習演算法,以及每種演算法的示例和程式碼實現(Python)、如何做演算法的引數除錯、以實際應用案例分析各種演算法的選擇等。

主講老師: 鄒博 小象學院簽約講師 

計算機博士,現科學院從事科研教學工作;主持國家級科研專案2個,副負責1個,國家專利2項,研究方向機器學習、資料探勘、計算幾何,應用於股票交易與預測、醫藥影像識別、智慧畜牧等方向。擅長機器學習模型選擇、核心演算法分析和程式碼實現。

開課時間:2017年11月24日

學習方式:

線上直播,共24次

每週3次(週一、三、五晚上20:00-22:00

直播後提供錄製回放視訊,線上反覆觀看,有效期1年

升級版的內容特色:

1.每個演算法模組按照“原理講解→分析資料→自己動手實現→特徵與調參”的順序,“原理加實踐,頂天立地”。

2.拒絕簡單的“調包”——增加3次“機器學習的角度看數學”和3次“Python資料清洗和特徵提取”,提升學習深度、降低學習坡度。

3.增加網路爬蟲的原理和編寫,從獲取資料開始,重視將實踐問題轉換成實際模型的能力,分享工作中的實際案例或Kaggle案例:廣告銷量分析、環境資料異常檢測和分析、數字影像手寫體識別、Titanic乘客存活率預測、使用者-電影推薦、真實新聞組資料主題分析、中文分詞、股票資料特徵分析等。

4.強化矩陣運算、概率論、數理統計的知識運用,掌握機器學習根本。

5.闡述機器學習原理,提供配套原始碼和資料;確保“懂推導,會實現”。

6.刪去過於晦澀的公式推導,代之以直觀解釋,增強感性理解。

7.對比不同的特徵選擇帶來的預測效果差異。

8.重視專案實踐(如工業實踐、Kaggle等),重視落地。思考不同演算法之間的區別和聯絡,提高在實際工作中選擇演算法的能力。

9.涉及和講解的部分Python庫有:Numpy、Scipy、matplotlib、Pandas、scikit-learn、XGBoost、libSVM、LDA、Gensim、NLTK、HMMLearn,涉及的其他“小”庫在課程的實踐環節會逐一講解。

課程大綱

第一課:機器學習的數學基礎1 - 數學分析

 

1.  機器學習的一般方法和橫向比較

2.  數學是有用的:以SVD為例

3.  機器學習的角度看數學

4.  複習數學分析

5.  直觀解釋常數e

6.  導數/梯度

7.  隨機梯度下降

8.  Taylor展式的落地應用

9.  gini係數

10. 凸函式

11. Jensen不等式

12. 組合數與資訊熵的關係

 

第二課:機器學習的數學基礎2 - 概率論與貝葉斯先驗

 

1.  概率論基礎

2.  古典概型

3.  貝葉斯公式

4.  先驗分佈/後驗分佈/共軛分佈

5.  常見概率分佈

6.  泊松分佈和指數分佈的物理意義

7.  協方差(矩陣)和相關係數

8.  獨立和不相關

9.  大數定律和中心極限定理的實踐意義

10.  深刻理解最大似然估計MLE和最大後驗估計MAP

11.  過擬合的數學原理與解決方案

 

第三課:機器學習的數學基礎3 - 矩陣和線性代數

 

1.  線性代數在數學科學中的地位

2.  馬爾科夫模型

3.  矩陣乘法的直觀表達

4.  狀態轉移矩陣

5.  矩陣和向量組

6.  特徵向量的思考和實踐計算

7.  QR分解

8.  對稱陣、正交陣、正定陣

9.  資料白化及其應用

10.  向量對向量求導

11.  標量對向量求導

12.  標量對矩陣求導

 

第四課:Python基礎1 - Python及其數學庫

 

1.  直譯器Python2.7與IDE:Anaconda/ Pycharm

2.  Python基礎:列表/元組/字典/類/檔案

3.  Taylor展式的程式碼實現

4.  numpy/scipy/matplotlib/panda的介紹和典型使用

5.  多元高斯分佈

6.  泊松分佈、冪律分佈

7.  典型影像處理

8.  蝴蝶效應

9.  分形與視覺化

 

第五課:Python基礎2 - 機器學習庫

 

1.  scikit-learn的介紹和典型使用

2.  損失函式的繪製

3.  多種數學曲線

4.  多項式擬合

5.  快速傅立葉變換FFT

6.  奇異值分解SVD

7.  Soble/Prewitt/Laplacian運算元與卷積網路

8.  卷積與(指數)移動平均線

9.  股票資料分析

 

第六課:Python基礎3 - 資料清洗和特徵選擇

 

1.  實際生產問題中演算法和特徵的關係

2.  股票資料的特徵提取和應用

3.  一致性檢驗

4.  缺失資料的處理

5.  環境資料異常檢測和分析

6.  模糊資料查詢和資料校正方法、演算法、應用

7.  樸素貝葉斯用於鳶尾花資料

8.  GaussianNB/MultinomialNB/BernoulliNB

9.  樸素貝葉斯用於18000+篇/Sogou新聞文字的分類

 

第七課: 迴歸

 

1.  線性迴歸

2.  Logistic/Softmax迴歸

3.  廣義線性迴歸

4.  L1/L2正則化

5.  Ridge與LASSO

6.  Elastic Net

7.  梯度下降演算法:BGD與SGD

8.  特徵選擇與過擬合

 

第八課:Logistic迴歸

 

1.  Sigmoid函式的直觀解釋

2.  Softmax迴歸的概念源頭

3.  Logistic/Softmax迴歸

4.  最大熵模型

5.  K-L散度

6.  損失函式

7.  Softmax迴歸的實現與調參

 

第九課:迴歸實踐

 

1.  機器學習sklearn庫介紹

2.  線性迴歸程式碼實現和調參

3.  Softmax迴歸程式碼實現和調參

4.  Ridge迴歸/LASSO/Elastic Net

5.  Logistic/Softmax迴歸

6.  廣告投入與銷售額迴歸分析

7.  鳶尾花資料集的分類

8.  交叉驗證

9.  資料視覺化

 

第十課:決策樹和隨機森林

 

1.  熵、聯合熵、條件熵、KL散度、互資訊

2.  最大似然估計與最大熵模型

3.  ID3、C4.5、CART詳解

4.  決策樹的正則化

5.  預剪枝和後剪枝

6.  Bagging

7.  隨機森林

8.  不平衡資料集的處理

9.  利用隨機森林做特徵選擇

10. 使用隨機森林計算樣本相似度

11. 資料異常值檢測

 

第十一課:隨機森林實踐

 

1.  隨機森林與特徵選擇

2.  決策樹應用於迴歸

3.  多標記的決策樹迴歸

4.  決策樹和隨機森林的視覺化

5.  葡萄酒資料集的決策樹/隨機森林分類

6.  波士頓房價預測

 

第十二課:提升

 

1.  提升為什麼有效

2.  梯度提升決策樹GBDT

3.  XGBoost演算法詳解

4.  Adaboost演算法

5.  加法模型與指數損失

 

第十三課:提升實踐

 

1.  Adaboost用於蘑菇資料分類

2. Adaboost與隨機森林的比較

3.  XGBoost庫介紹

4.  Taylor展式與學習演算法

5.  KAGGLE簡介

6.  泰坦尼克乘客存活率估計

 

第十四課:SVM

 

1.  線性可分支援向量機

2.  軟間隔的改進

3.  損失函式的理解

4.  核函式的原理和選擇

5.  SMO演算法

6.  支援向量迴歸SVR

 

第十五課:SVM實踐

 

1.  libSVM程式碼庫介紹

2.  原始資料和特徵提取

3.  葡萄酒資料分類

4.  數字影像的手寫體識別

5.  SVR用於時間序列曲線預測

6.  SVM、Logistic迴歸、隨機森林三者的橫向比較

 

第十六課:聚類(上)

 

1.  各種相似度度量及其相互關係

2.  Jaccard相似度和準確率、召回率

3.  Pearson相關係數與餘弦相似度

4.  K-means與K-Medoids及變種

5.  AP演算法(Sci07)/LPA演算法及其應用

 

第十七課:聚類(下)

 

1.  密度聚類DBSCAN/DensityPeak(Sci14)

2.  DensityPeak(Sci14)

3.  譜聚類SC

4.  聚類評價AMI/ARI/Silhouette

5.  LPA演算法及其應用

 

第十八課:聚類實踐

 

1.  K-Means++演算法原理和實現

2.  向量量化VQ及影像近似

3.  並查集的實踐應用

4.  密度聚類的程式碼實現

5.  譜聚類用於圖片分割

 

第十九課:EM演算法

 

1.  最大似然估計

2.  Jensen不等式

3.  樸素理解EM演算法

4.  精確推導EM演算法

5.  EM演算法的深入理解

6.  混合高斯分佈

7.  主題模型pLSA

 

第二十課:EM演算法實踐

 

1.  多元高斯分佈的EM實現

2.  分類結果的資料視覺化

3.  EM與聚類的比較

4.  Dirichlet過程EM

5.  三維及等高線等圖件的繪製

6.  主題模型pLSA與EM演算法

 

 第二十一課:主題模型LDA

 

1.  貝葉斯學派的模型認識

2.  Beta分佈與二項分佈

3.  共軛先驗分佈

4.  Dirichlet分佈

5.  Laplace平滑

6.  Gibbs取樣詳解

 

第二十二課:LDA實踐

 

1.  網路爬蟲的原理和程式碼實現

2.  停止詞和高頻詞

3.  動手自己實現LDA

4.  LDA開源包的使用和過程分析

5.  Metropolis-Hastings演算法

6.  MCMC

7.  LDA與word2vec的比較

8.  TextRank演算法與實踐

 

第二十三課:隱馬爾科夫模型HMM

 

1.  概率計算問題

2.  前向/後向演算法

3.  HMM的引數學習

4.  Baum-Welch演算法詳解

5.  Viterbi演算法詳解

6.  隱馬爾科夫模型的應用優劣比較

 

第二十四課:HMM實踐

 

1.  動手自己實現HMM用於中文分詞

2.  多個語言分詞開源包的使用和過程分析

3.  檔案資料格式UFT-8、Unicode

4.  停止詞和標點符號對分詞的影響

5.  前向後向演算法計算概率溢位的解決方案

6.  發現新詞和分詞效果分析

7.  高斯混合模型HMM

8.  GMM-HMM用於股票資料特徵提取


(點選左下角閱讀原文瞭解更多)


參團!諮詢!檢視課程!

就點這裡!

640?

相關文章