講述了迴歸模型的基本原理和演算法,並結合迴歸介紹了交叉驗證的方法

1 預測房價
1.1 通過相似的房子預測你的房子


2 線性迴歸
2.1 應用線性迴歸模型



那麼哪條線才是最好的呢?
2.2 應用一條線的成本

2.3 預測你的房價

3 加入更高階的因素
3.1 用直線擬合房價或者...?

3.2 如果用二次函式怎麼樣?

3.3 更高階的多項式

4 你相信這個模型嗎?
顯然,相比二次函式並不好!!! 過擬合

5 通過訓練-測試分離來評估過擬合
你相信這個擬合嗎?

二次函式怎麼樣呢

如何選擇模型階數 / 複雜度

訓練 / 測試分離

- 訓練集 用於模型構建
- 測試集 用於檢測模型構建,此資料只在模型檢驗時使用,用於評估模型的準確率
訓練誤差
- 藍色點為訓練集資料
測試誤差

6 訓練測試曲線

7 加入新的特徵
僅僅通過房屋大小預測

加入其他的特徵

應該選擇多少特徵

8 其他迴歸示例
薪資預測


股票預測

微博流行度

智慧房屋

9 迴歸總結
機器學習流水線

