過擬合和欠擬合以及相對應的解決辦法

dicksonjyl560101發表於2018-08-18

原文網址 : http://blog.itpub.net/29829936/viewspace-2200352/

https://blog.csdn.net/weixin_42137700/article/details/81806419

欠擬合：是指模型的學習能力比較低，以至於，只學到了很少的一部分資訊，當進行預測的時候，會發生方差最低，和偏差較大的情況
過擬合：是指模型的學習能力比較強，以至於，直接把題給背下來了，如果考到原題，就會實現相應的預測100%，如果預測的不再訓練集中，那麼結果就是0.
過擬合是偏差較小，但是方差較大
上面的較小與較大是和不欠擬合也不過擬合的相比而言的，這也在某種程度上說明了，偏差和方差是一個均衡的狀態，一個高一個低，高和低都不好
mse=var+bias

過擬合和欠擬合以及相對應的解決辦法

圖片來源於華東師範大學茆師鬆的書，出版社是高等教育

欠擬合的解決辦法
1）新增其他特徵項，有時候我們模型出現欠擬合的時候是因為特徵項不夠導致的，可以新增其他特徵項來很好地解決。例如，“組合”、“泛化”、“相關性”三類特徵是特徵新增的重要手段，無論在什麼場景，都可以照葫蘆畫瓢，總會得到意想不到的效果。除上面的特徵之外，“上下文特徵”、“平臺特徵”等等，都可以作為特徵新增的首選項。
2）新增多項式特徵，這個在機器學習演算法裡面用的很普遍，例如將線性模型通過新增二次項或者三次項使模型泛化能力更強。例如上面的圖片的例子。
3）減少正則化引數，正則化的目的是用來防止過擬合的，但是現在模型出現了欠擬合，則需要減少正則化引數。
4）增加模型複雜度。如果模型太簡單，不能夠應對複雜的任務。可以使用更復雜的模型，減小正則化係數。具體來說可以使用核函式，整合學習方法，深度學習等。
整合學習方法boosting（如GBDT,xgboost，adaboost）能有效解決high bias，
過擬合解決辦法：
解決方法：
1) 合適的模型(simpler model structure)
2) 正則化(regularization) L2正則化
3) 資料增強(data augmention)
4) 隨機失活(Dropout) 或者weight decy
5) 批規範化(batch normalization)
6) Bagging和其他整合模型例如：隨機森林模型可以
7）重新清洗資料，導致過擬合的一個原因也有可能是資料不純導致的，如果出現了過擬合就需要我們重新清洗資料。
8）增大資料的訓練量，還有一個原因就是我們用於訓練的資料量太小導致的，訓練資料佔總資料的比例過小。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/29829936/viewspace-2200352/，如需轉載，請註明出處，否則將追究法律責任。

降低過擬合和欠擬合的方法
2019-03-04
過擬合與欠擬合
2020-10-30
深度學習中的欠擬合和過擬合簡介
2018-10-04
深度學習
今日面試題分享：如何理解模型的過擬合與欠擬合，以及如何解決？
2019-03-21
面試題模型
機器學習–過度擬合欠擬合
2018-12-08
機器學習
欠擬合與過擬合技術總結
2021-06-14
什麼是人工智慧領域的過擬合和欠擬合
2023-05-12
人工智慧
過擬合與欠擬合-股票投資中的機器學習
2019-01-30
機器學習
演算法金 | 詳解過擬合和欠擬合！性感嫵媚 VS 大殺四方
2024-05-30
演算法
如何解決過度擬合
2023-05-14
Pytorch_第八篇_深度學習 (DeepLearning) 基礎 [4]---欠擬合、過擬合與正則化
2020-08-05
PyTorch深度學習
梯度下降、過擬合和歸一化
2018-09-08
梯度
擬合
2020-10-09
什麼是機器學習迴歸演算法？【線性迴歸、正規方程、梯度下降、正則化、欠擬合和過擬合、嶺迴歸】
2022-04-06
機器學習演算法梯度
YOLOv3訓練過程中出現過擬合現象的解決方法
2020-10-21
YOLO
Tensorflow-交叉熵&過擬合
2021-01-28
熵
機器學習中的過擬合
2019-02-13
機器學習
防止或減輕過擬合的方法
2020-11-21
用Keras中的權值約束緩解過擬合
2018-12-10
Keras
深度學習中“過擬合”的產生原因和解決方法
2020-09-30
深度學習
vmware虛擬機器執行卡慢的解決辦法
2018-07-12
虛擬機
VirtualBox 主機ping不通虛擬機器的解決辦法
2020-12-27
虛擬機
機器學習之過擬合的風險
2020-06-14
機器學習
你遇到過的相容性問題以及解決辦法
2019-04-17
sbt下載相關依賴過慢的解決辦法
2019-07-03
Origin進行多元線性迴歸、指數擬合和非線性曲面擬合
2020-12-02
模擬量輸出的常用應用場合
2020-09-23
原理解析-過擬合與正則化
2020-12-05
虛擬機器ping不通的幾種原因及解決辦法
2022-06-10
虛擬機
關於vm虛擬機器不能上網的解決辦法
2020-11-25
虛擬機
Wannier 單帶擬合
2020-11-13
Python擬合曲線
2024-07-29
Python
過擬合詳解：監督學習中不準確的「常識」
2019-01-25
4擬合線性函式的k和b
2020-11-12
函式
Xshell連線不上虛擬機器的解決辦法彙總
2020-12-06
虛擬機
基於simulink的模擬鎖相環和數字鎖相環建模與對比模擬
2024-12-08
Android開發過程中遇到的問題以及解決辦法 how to
2024-07-08
Android
“聯合對抗火災”最真實的消防模擬遊戲《模擬消防英豪》
2020-12-04
遊戲

過擬合和欠擬合以及相對應的解決辦法

相關文章