講述了迴歸模型的基本原理和演算法,並結合迴歸介紹了交叉驗證的方法
1 預測房價
1.1 通過相似的房子預測你的房子
2 線性迴歸
2.1 應用線性迴歸模型
那麼哪條線才是最好的呢?
2.2 應用一條線的成本
2.3 預測你的房價
3 加入更高階的因素
3.1 用直線擬合房價或者...?
3.2 如果用二次函式怎麼樣?
3.3 更高階的多項式
4 你相信這個模型嗎?
顯然,相比二次函式並不好!!! 過擬合
5 通過訓練-測試分離來評估過擬合
你相信這個擬合嗎?
二次函式怎麼樣呢
如何選擇模型階數 / 複雜度
訓練 / 測試分離
- 訓練集 用於模型構建
- 測試集 用於檢測模型構建,此資料只在模型檢驗時使用,用於評估模型的準確率
訓練誤差
- 藍色點為訓練集資料
測試誤差
6 訓練測試曲線
7 加入新的特徵
僅僅通過房屋大小預測
加入其他的特徵
應該選擇多少特徵
8 其他迴歸示例
薪資預測
股票預測
微博流行度
智慧房屋
9 迴歸總結
機器學習流水線