機器學習4-模型的誤差來源以及減少誤差的方法

weixin_45540546發表於2020-11-01

原文網址 : https://blog.csdn.net/weixin_45540546/article/details/109412086

機器學習模型

誤差來源的兩個方面：

bias（偏差）：度量了某種學習演算法的平均估計結果所逼近的學習目標的程度。
variance（方差）:度量了在面對同樣規模的不同訓練集時分散的程度。
高的bias表示離目標值遠，低bias表示離靶心近；高的variance表示多次學習的結果越分散，低的variance表示多次學習的結果越集中。
區別
variance反映的是模型每一次輸出結果與模型輸出期望之間的誤差，即模型的穩定性。
bias反映的是模型在樣本上的輸出與真實值之間的誤差，即模型本身的精準度。

先看沒有bias存在的情況

在這裡插入圖片描述

圖中的N個點他們的平均值不等μ，但是當取值足夠多，它的期望與μ相等。比喻就是，沒有bias就是說瞄準的是靶心沒有偏差，但是射擊的時候由於一些因素，實際射擊的位置散落在了μ的周圍。

不同訓練集分散的程度取決於variance：

在這裡插入圖片描述

怎麼估測variance：

當N足夠大時，s方的期望才會等於variance。

例子比喻

不同的f*是不同訓練集的原因
在這裡插入圖片描述

簡單的模型往往對應著比較大的bias，複雜的模型往往對應著較小的bias.

bias和variance

可以看出隨著模型逐漸複雜，bias逐漸變小，variance逐漸變大。bias大，variance小的情況意味著欠擬合；bias小，variance大的情況意味著過擬合。

對於較大的bias怎麼進行處理：

如果模型無法fit訓練集代表bias比較大，即欠擬合。
如果模型在訓練集表現好，在測試集表現較差，則屬於過擬合。
在這裡插入圖片描述
對於bias較大處理方法：
1、加入更多的feature
2、設計更加複雜的模型

對於較大的variance怎麼進行處理：

1、增加資料（非常有效，但是不太實際）
2、正則化（regularization）(需要調節bias和variance之間的平衡關係)
在這裡插入圖片描述

怎麼進行模型選擇

用擁有的測試集上的準確率最好的模型，應用於實際場合中，效果不一定好
在這裡插入圖片描述
如何防止上述情況：
cross validation（交叉驗證）：
N折交叉驗證

對模型進行交叉驗證，選出平均錯誤率最低的模型，然後利用此模型對所有的樣本重訓練。

相關文章

TRIZ在減少人為誤差原理上的應用
2022-12-02
【機器學習】數值分析01——緒論及誤差分析
2022-02-07
機器學習
機器學習策略篇：詳解進行誤差分析（Carrying out error analysis）
2024-06-07
機器學習Error
SAR運動誤差的補償
2024-06-07
移動端1px誤差的原因以及解決方案
2018-10-09
Origin2024如何繪製誤差棒圖？直觀看出每個資料點的誤差
2024-07-18
預測的必要性和誤差的必然
2022-05-06
繪製帶誤差分析的柱狀圖
2024-07-11
dmesg 時間誤差現象
2023-04-03
IDC售後服務怎樣減少差評？
2020-08-31
神經網路模型與誤差逆傳播演算法
2021-01-10
神經網路模型演算法
「機器學習速成」正則化：降低模型的複雜度以減少過擬合
2019-06-21
機器學習模型複雜度
距離容差來源
2020-10-22
數值分析1 - 誤差概念介紹
2021-01-04
機器學習-演算法背後的理論與優化(part3)--經驗風險與泛化誤差概述
2020-11-04
機器學習演算法優化
K-Means聚類分析以及誤差平方和SSE（Python實現）
2024-11-14
聚類Python
減少失誤提高策略性，ACT遊戲中的戰鬥資源控制
2022-04-14
遊戲
js處理浮點數計算誤差
2018-12-07
JS
DeepMind依靠CBN統計方法來構建公平的機器學習模型
2020-10-25
機器學習模型
通俗易懂講解ML中的均方誤差 (MSE) - haltakov
2021-11-20
如何正確地做誤差分析，NLP研究人員們需要學習一下
2019-08-23
自適應辛普森積分與誤差證明
2021-06-15
webpack 4.0 學習日誌（一）——配置方法以及錯誤解決
2018-03-19
Web
差分學習筆記
2024-04-07
筆記
IT職場：PFMEA是如何減少製造過程中的錯誤的？
2024-03-07
11 個 AI 和機器學習模型的開源框架
2018-08-13
AI機器學習模型框架
VNPY 價差交易模組的使用學習
2019-09-02
STM32H723 ADC+DMA 誤差解決
2024-10-24
軌跡跟蹤誤差直降50％，清華汪玉團隊強化學習策略秘籍搞定無人機
2024-12-27
強化學習無人機
Python浮點數（小數）運算誤差的原因和解決辦法
2019-07-09
Python
關於核心體驗和功能堆積不協調的完美誤差
2022-07-08
機器學習的教訓：5家公司分享的錯誤經驗
2018-12-27
機器學習
為什麼計算機對浮點型數字計算存在誤差
2023-04-11
計算機
RealFormer: 殘差式 Attention 層的Transformer 模型
2022-02-08
ORM模型
神經網路學習筆記（4）——期望與算術平均值的區別、方差與均方誤差的區別
2020-10-05
神經網路筆記
機器學習模型
2024-03-30
機器學習模型
人大劉勇團隊「慢思考」機理分析：從雪球誤差到正確推理機率
2025-02-10
聊聊一個差點被放棄的專案以及近期的開源計劃
2024-05-23