機器學習入門(二) — 迴歸模型 (理論)

JavaEdge發表於2018-12-07

講述了迴歸模型的基本原理和演算法,並結合迴歸介紹了交叉驗證的方法

近期房屋的銷售情況圖示(過去兩年)

1 預測房價

1.1 通過相似的房子預測你的房子

機器學習入門(二) — 迴歸模型 (理論)
機器學習入門(二) — 迴歸模型 (理論)

2 線性迴歸

2.1 應用線性迴歸模型

機器學習入門(二) — 迴歸模型 (理論)
機器學習入門(二) — 迴歸模型 (理論)
機器學習入門(二) — 迴歸模型 (理論)

那麼哪條線才是最好的呢?

2.2 應用一條線的成本

機器學習入門(二) — 迴歸模型 (理論)

2.3 預測你的房價

機器學習入門(二) — 迴歸模型 (理論)

3 加入更高階的因素

3.1 用直線擬合房價或者...?

機器學習入門(二) — 迴歸模型 (理論)

3.2 如果用二次函式怎麼樣?

機器學習入門(二) — 迴歸模型 (理論)

3.3 更高階的多項式

機器學習入門(二) — 迴歸模型 (理論)

4 你相信這個模型嗎?

顯然,相比二次函式並不好!!! 過擬合

機器學習入門(二) — 迴歸模型 (理論)

5 通過訓練-測試分離來評估過擬合

你相信這個擬合嗎?

機器學習入門(二) — 迴歸模型 (理論)

二次函式怎麼樣呢

機器學習入門(二) — 迴歸模型 (理論)

如何選擇模型階數 / 複雜度

機器學習入門(二) — 迴歸模型 (理論)

訓練 / 測試分離

機器學習入門(二) — 迴歸模型 (理論)

  • 訓練集 用於模型構建
  • 測試集 用於檢測模型構建,此資料只在模型檢驗時使用,用於評估模型的準確率

訓練誤差

  • 藍色點為訓練集資料
    機器學習入門(二) — 迴歸模型 (理論)

測試誤差

機器學習入門(二) — 迴歸模型 (理論)

6 訓練測試曲線

機器學習入門(二) — 迴歸模型 (理論)

7 加入新的特徵

僅僅通過房屋大小預測

機器學習入門(二) — 迴歸模型 (理論)

加入其他的特徵

機器學習入門(二) — 迴歸模型 (理論)

應該選擇多少特徵

機器學習入門(二) — 迴歸模型 (理論)

8 其他迴歸示例

薪資預測

機器學習入門(二) — 迴歸模型 (理論)
機器學習入門(二) — 迴歸模型 (理論)

股票預測

機器學習入門(二) — 迴歸模型 (理論)

微博流行度

機器學習入門(二) — 迴歸模型 (理論)

智慧房屋

機器學習入門(二) — 迴歸模型 (理論)

9 迴歸總結

機器學習流水線

機器學習入門(二) — 迴歸模型 (理論)
機器學習入門(二) — 迴歸模型 (理論)

相關文章