偏差-方差間權衡

AI學習發表於2019-01-21

原文網址 : https://www.jiqizhixin.com/articles/2019-01-11-4

請注意: 本文是翻譯的一份學習資料，

中文版地址： https://dark417.github.io/MachineLearning/sv_bias_variance_tradeoff_ch/

英文原版請點選Wei的學習筆記: https://wei2624.github.io/MachineLearning/sv_bias_varience_tradeoff/。中文筆記將不斷和原作者的英文筆記同步內容，定期更新和維護。

在這一節中，我們重點討論偏差和誤差之間是如何相互關聯的。我們總想擁有0偏差和0方差，然而在實際中這是不可能的。因此，它們之間總會有權衡，一者多，另一者少。

1 偏差-方差間權衡 (Bias Variance Tradeoff)

我們將基於一些樣本訓練好的模型定義為偏差-方差間權衡，並且y為事實標籤。因此，均方差(mean squared error(MSE))可以定義為：

偏差-方差間權衡

對於很高的均方差，我們有以下3種解釋：

過渡擬合(overfitting): 模型只在訓練樣本中表現良好，但是並不能很好地推廣適用到測試資料上。

欠擬合(underfitting): 模型訓練還不夠，或者沒有足夠的訓練資料，以至於模型不能很好的表示訓練資料的情況。

兩者都不: 資料的噪音(noise)太大。

我們將這些情況歸納為偏差-方差權衡(Bias-Variance Tradeoff)。

假設所有資料都來自於以下定義的相似的分佈：偏差-方差間權衡其中噪音。

儘管我們的目標是計算f，但我們只能透過從以上分佈所產生的樣本中訓練得到一個估值。因此，偏差-方差間權衡是隨機的，因為它取決於隨機的，並且它也是的預測值。因此，得出是很合理的。

我們也可以計算MSE的期望：

偏差-方差間權衡

第一項是我們無法處理的噪聲。高偏差意味著模型的學習效率很低，並且欠擬合。一個高度的方差代表著模型不能很好的概括更多普通的情況，同時代表過渡擬合。

2 誤差分析 (Error Aanalysis)

為了分析一個模型，我們應該首先將模型模組化。然後我們將每個模組的事實標籤代入到每一模組中，觀察每一個變化會如何影響整體模型的精確度。我們試圖觀察事實標籤中的哪個模組對模型系統的影響最大。以下是一個例子

組成	精確度
總體系統	85%
預處理（移除背景）	85.1%
臉部識別	91%
眼部分割	95%
鼻子分割	96%
嘴部分割	97%
邏輯迴歸	100%

表1：這個表給出了模組化對應的準確度

3 去除分析 (Ablative Analysis)

誤差分析試圖識別模型當前表現與完美表現之前的區別，而去除分析試圖識別基準線與當前模型之前的區別。去除分析非常重要，很多研究論文因為丟失了這部分而被拒絕。這個分析可以告訴我們模型的哪個部分是最具影響力的。

例如，假設我們有更多附加的特徵可以讓模型表現更好。我們想觀察透過每一次減少一個附加的特徵，模型的表現會減少多少。下面是一個例子

組成	準確率
總體系統	99.9%
拼寫校對	99.0%
傳送人特徵	98.9%
郵件標題特徵	98.9%
郵件正文特徵	95%
Javascript解析器	94.5%
圖片中的特徵點	94.0%

整合學習-偏差與方差
2022-04-18
高/低方差、高/低偏差
2020-12-24
方差與偏差的解釋和解決辦法
2021-01-04
吳恩達機器學習系列14：偏差與方差
2019-03-31
吳恩達機器學習
AI學習筆記——Bias and Variance tradeoff (方差偏差的平衡)
2018-06-05
AI筆記
機器學習中偏差bias和方差variance區別
2021-04-29
機器學習
演算法模型定量分析之偏差和方差
2020-12-09
演算法模型
機器學習《Machine Learning》筆記--偏差（Bias）和方差（Variance）
2018-06-05
機器學習Mac筆記
資料變異性的度量 - 極差、IQR、方差和標準偏差
2022-11-23
sql與nosql的權衡
2018-07-14
SQL
NAND FLASH系統的權衡利弊
2020-12-10
NaN
第二週【任務2】貝葉斯估計，估計、偏差和方差，邏輯迴歸
2020-12-03
邏輯迴歸
實習轉正和校招如何權衡？
2019-11-06
IO裝置在OS中的權衡
2019-05-11
【機器學習】第二節-模型評估與選擇-效能度量、方差與偏差、比較檢驗
2024-05-17
機器學習模型
方差
2024-05-19
認知偏差之注意力偏差
2022-04-27
演算法金 | 協方差、方差、標準差、協方差矩陣
2024-06-29
演算法矩陣
有錢和有趣，遊戲公司該如何權衡？
2020-06-01
遊戲
現代分散式系統架構的權衡分析
2024-03-07
分散式架構
如何權衡業務規則的遵守與違反？
2022-04-19
從16-bit 到 1.58-bit ：大模型記憶體效率和準確性之間的最佳權衡
2024-03-11
大模型記憶體
07_異方差
2024-05-03
為什麼以及如何要進行架構設計權衡？
2024-06-03
架構
多資料來源與動態資料來源的權衡
2019-03-04
線性思考、設計思考和系統思考三者權衡
2022-12-04
如何權衡設計可擴充套件的有界上下文？ (mathiasverraes)
2021-04-10
套件
方差與標準差
2024-03-28
互資訊-協方差
2024-10-11
可觀測建設實踐之 - 日誌分析的權衡取捨
2024-04-02
python 計算list的方差
2024-08-21
Python
如何使用方差分析（ANOVA）？
2022-05-27
Flash Attention穩定嗎？Meta、哈佛發現其模型權重偏差呈現數量級波動
2024-05-13
模型
二十條有用的認知偏差
2022-11-26
基本概念(二）：方差、協方差、相關係數原點矩和中心矩
2024-04-13
如何權衡實習轉正和秋招？我想給你這幾條建議
2019-03-12
協方差矩陣推導1
2024-10-19
矩陣
Python求均值，方差，標準差
2021-09-09
Python

偏差-方差間權衡

1 偏差-方差間權衡 (Bias Variance Tradeoff)

2 誤差分析 (Error Aanalysis)

3 去除分析 (Ablative Analysis)

相關文章