【機器學習】李宏毅——機器學習任務攻略

FavoriteStar發表於2022-12-14

原文網址 : https://www.cnblogs.com/FavoriteStar/p/16983202.html

這一節的主要內容是當測試資料的準確度不夠高的時候應該怎麼做。

首先一定要檢查你的訓練資料集的誤差，如果發現是你的訓練資料集誤差也比較大，那麼就有兩種可能：

模型過於簡單，無法很好的擬合當前的資料集
陷入區域性最優價，也就是最佳化演算法做的不夠好

那麼如果分辨這兩種情況呢？找模型來比較
在這裡插入圖片描述

例如在上圖，一個20層的神經網路和56層的神經網路，發現測試集上56層的神經網路的誤差更大，那麼這很容易讓我們覺得這是過擬合的問題，但是如果我們檢查一下訓練集的誤差發現，同樣是56層的誤差更大，這就說明不是過擬合，如果是過擬合應該是56層的網路的訓練集的誤差很小才對，那麼56層的神經網路肯定比20層的複雜度高，只剩下一種可能就是最佳化演算法做得不夠好

那麼這給我們的啟發就是，在面對一個未知的問題時可以這樣做：

先訓練一些簡單的模型，比如層次較低的神經網路，比較SVM，這些模型的最佳化演算法比較容易實現，就會找到在這個模型複雜度下的最優價
再訓練複雜的模型，如果複雜的模型明明彈性（即複雜度）比簡單的模型更大，可誤差反而更加不理想，那麼可能就是複雜模型的最佳化演算法做得不夠好了

那麼經過上述解決完訓練資料的問題，使得訓練資料精度足夠小時再重新計算測試資料的精度，如果此時仍然是測試資料的誤差很大，那麼就有可能是真的遇到了過擬合的問題，甚至是遇到了mismatch問題，解決辦法有兩個：

最直接的方法就是增加訓練資料集。例如找新的資料，或者對資料進行處理，影像翻轉等等
給模型更多的限制，例如給比較少的引數，共用引數，正則化、早停等等

模型複雜度與誤差的曲線大致如下：

在這裡插入圖片描述

在選取不同的模型時，最好是不要直接在測試集上比較，因為測試集是用來衡量該模型的泛化誤差的，因此通常是將原本的訓練集分為訓練集和驗證集兩部分，在訓練集上訓練各個不同的模型，然後再在驗證集上選出最好的模型，再在測試集上得到該模型的泛化能力。那麼這個時候就要考慮到驗證集選取的問題了，為了避免隨機選取到不合適的驗證集，可以用k折交叉驗證：
在這裡插入圖片描述

即將訓練資料進行k等分，然後選取其中一個作為驗證集其他作為訓練集，然後訓練模型並驗證在驗證集上的好壞，這個操作重複k次保證每一個子集都有機會當驗證集，之後將k次結果去平均即可。

mismatch問題就是訓練集的分佈和測試集的分佈是不同的分佈，這就導致不管你如何增加訓練集的資料或者改進模型都很難在測試集上取得好的結果。

【機器學習】李宏毅——Transformer
2022-12-18
機器學習ORM
【機器學習】李宏毅——Unsupervised Learning
2022-12-21
機器學習
【機器學習】李宏毅——機器學習基本概念簡介
2022-12-14
機器學習
【機器學習】李宏毅——自監督式學習
2022-12-19
機器學習
【機器學習】李宏毅——線性降維
2022-12-16
機器學習
【機器學習】李宏毅——Explainable ML(可解釋性的機器學習)
2022-12-22
機器學習AI
【機器學習】李宏毅——Flow-based Generative Models
2022-12-22
機器學習
【機器學習】李宏毅——何為反向傳播
2022-12-15
機器學習反向傳播
【機器學習】李宏毅——Adversarial Attack（對抗攻擊）
2022-12-23
機器學習
【機器學習】李宏毅——Anomaly Detection（異常檢測）
2022-12-20
機器學習
【機器學習】李宏毅——AE自編碼器(Auto-encoder)
2022-12-20
機器學習
【機器學習】李宏毅——淺談機器學習原理+魚與熊掌兼得的深度學習簡述
2022-12-15
機器學習深度學習
李巨集毅機器學習-學習筆記
2018-11-13
機器學習筆記
李宏毅2022機器學習HW4 Speaker Identification下
2024-03-02
機器學習IDE
【機器學習】李宏毅——Domain Adaptation(領域自適應)
2022-12-23
機器學習AIAPT
【機器學習】李宏毅——生成式對抗網路GAN
2022-12-18
機器學習
【機器學習】李宏毅——自注意力機制(Self-attention)
2022-12-16
機器學習
【機器學習】李宏毅——Recurrent Neural Network(迴圈神經網路)
2022-12-17
機器學習神經網路
李巨集毅機器學習課程筆記-1.機器學習概論
2020-12-22
機器學習筆記
李宏毅2022機器學習HW4 Speaker Identification上(Dataset &Self-Attention)
2024-03-01
機器學習IDE
《李宏毅機器學習完整筆記》釋出，Datawhale開源專案LeeML-Notes
2019-08-07
機器學習筆記
【機器學習】李宏毅——類神經網路訓練不起來怎麼辦
2022-12-15
機器學習神經網路
撒花！李巨集毅機器學習 2021 版正式開放上線
2021-03-07
機器學習
Datawhale X 李宏毅蘋果書 AI夏令營:task1透過案例瞭解機器學習
2024-08-27
蘋果AI機器學習
網路安全與機器學習（二）：網路安全任務如何結合機器學習？
2018-11-12
機器學習
重磅 | 李巨集毅機器學習 2019 最新版上線，中文授課！
2019-03-18
機器學習
李巨集毅機器學習課程筆記-3.梯度下降精講
2020-12-27
機器學習筆記梯度
李航「機器學習」最全綜述
2020-04-06
機器學習
【機器學習】機器學習簡介
2018-11-29
機器學習
[python學習]機器學習 -- 感知機
2020-10-19
Python機器學習
【機器學習】--Python機器學習庫之Numpy
2018-04-06
機器學習Python
大型機器學習【Coursera 史丹佛機器學習】
2021-09-09
機器學習
（一）機器學習和機器學習介紹
2021-09-09
機器學習
機器學習-整合學習
2019-05-12
機器學習
如何學習機器學習
2019-02-01
機器學習
機器學習（——）
2018-06-19
機器學習
機器學習
2024-05-19
機器學習
機器學習（十四）機器學習比賽網站
2018-12-06
機器學習網站

【機器學習】李宏毅——機器學習任務攻略

相關文章