機器學習課程筆記

撅嘴巴胡搞瞎搞發表於2018-05-15

挑戰問題:
1、泛化能力
SVM、整合學習泛化能力比較強
更準:大資料、模型
2、速度
訓練速度快的往往測試速度慢:KNN
測試速度快的往往訓練速度慢:神經網路
3、可理解性
黑盒子
4、資料利用能力
未標記資料、劣質資料
5、代價敏感
假陽性、假陰性問題

樣本空間
(屬性取值 - 1)…(屬性取值 - 1) + 1
版本空間
根據樣本匹配樣本空間結果形成版本空間,版本空間的屬性組合可以正確判別樣本結果

線性迴歸中的均方誤差叫做歐式距離也叫做L2正規化,基於均方誤差最小化求解最優模型的過程叫做最小二乘法
梯度下降

決策樹和隨機森林

相關文章