機器學習之簡化正則化:L2 正則化

Lois發表於2020-06-20

原文網址 : https://learnku.com/articles/46152?order_by=created_at&

請檢視以下泛化曲線, 該曲線顯示的是訓練集和驗證集相對於訓練迭代次數的損失.

圖 1.訓練集和驗證集損失

圖 1 顯示的是某個模型的訓練損失逐漸減少, 但驗證損失最終增加.換言之, 該泛化曲線顯示該模型與訓練集中的資料過擬合.根據奧卡姆剃刀定律, 或許我們可以通過降低複雜模型的複雜度來防止過擬合, 這種原則稱為正則化。
也就是說, 並非只是以最小化損失 ( 經驗風險最小化 ) 為目標:

minimize ( Loss ( Data|Model ))

而是以最小化損失和複雜度為目標, 這稱為結構風險最小化:

minimize(Loss(Data|Model) + complexity(Model))

現在, 我們的訓練優化演算法是一個由兩項內容組成的函式:一個是損失項, 用於衡量模型與資料的擬合度, 另一個則是正則化項, 用於衡量模型的複雜度。
機器學習速成課程重點介紹了這兩種衡量模型複雜度的常見方式 ( 這兩種方式有些相關 ):

將模型複雜度作為模型中所有特徵的權重的函式。
將模型複雜度作為具有非零權重的特徵總數的函式。
如果模型複雜度是權重的函式, 則特徵權重的絕對值越高, 對模型複雜度的貢獻就越大.
我們可以使用 L₂ 正則化公式來衡量複雜度, 該公式將正則化項定義為所有特徵權重的平方和:
L_2 regularization term = ||w||_{2}^{2} = w_{1}^{2} + w_{2}^{2} + ... +w_{n}^{2}
在這個公式中, 接近於 0 的權重對模型的複雜度幾乎沒有影響, 而離群值權重則可能會產生巨大的影響。
例如, 某個線性模型具有以下權重:
w_1 = 0.2, w_2 = 0.5, w_3 = 5, w_4 = 2, \\w_5 = 0.25, w_6 = 0.75

L_2 正則化項為 26.915:

w_{1}^{2} + w_{2}^{2} + **w_{3}^{2}** + w_{4}^{2} + w_{5}^{2 }+ w_{6}^{2}\\ = 0.2^{2} + 0.5^{2} + **5^{2}** + 1^{2} + 0.25^{2} + 0.75^{2}\\ = 0.04 + 0.25 + 25 + 1 + 0.0625 + 0.5625 = 26.915

但是w_3( 上述加粗內容 )

本作品採用《CC 協議》，轉載必須註明作者和本文連結

Hacking

機器學習之簡化正則化：Lambda
2020-06-21
機器學習
機器學習之稀疏性正則化：L1 正則化
2020-06-28
機器學習
「機器學習速成」稀疏性正則化：L1正則化
2019-06-24
機器學習
深度學習——正則化
2022-01-25
深度學習
【機器學習】--魯棒性調優之L1正則，L2正則
2018-03-31
機器學習
正則化
2023-04-06
[深度學習]L2正則化和權重衰退(Weight Decay)
2024-04-14
深度學習
吳恩達機器學習筆記 —— 8 正則化
2018-07-19
吳恩達機器學習筆記
機器學習筆記——模型選擇與正則化
2020-10-17
機器學習筆記模型
機器學習中的範數規則化-L0,L1和L2正規化
2019-02-20
機器學習
正則化詳解
2021-01-10
機器學習中的正則化到底是什麼意思？
2018-07-10
機器學習
學習筆記：深度學習中的正則化
2020-04-06
筆記深度學習
【機器學習基礎】正則化及多分類問題總結
2021-10-27
機器學習
Python學習之正則
2018-06-24
Python
正則化與模型選擇
2019-01-25
模型
正則化是幹嘛的
2024-03-09
使用PyTorch實現L1, L2和Elastic Net正則化
2024-05-10
PyTorchAST
pyhanlp 繁簡轉換之拼音轉換與字元正則化
2019-06-28
HanLP字元
js表情正則手機正則郵箱正則
2020-12-16
JS
JS 正則學習
2018-07-13
JS
機器學習基礎——規則化（Regularization）
2021-01-30
機器學習
深度學習中的正則化技術(附Python程式碼)
2018-05-25
深度學習Python
「機器學習速成」正則化：降低模型的複雜度以減少過擬合
2019-06-21
機器學習模型複雜度
【python介面自動化】- 正則用例引數化
2021-02-21
Python
L1 和L2(Frobenius弗羅貝尼烏斯)正則化複習筆記
2018-07-02
筆記
【scikit-learn基礎】--『預處理』之正則化
2023-12-18
10-正則化項-權重衰退
2024-08-24
正則學習小記
2018-11-28
基於正則化的多工聯邦
2024-09-29
7、超引數除錯、Batch正則化
2024-10-01
除錯BAT
從線性迴歸來理解正則化
2021-06-21
原理解析-過擬合與正則化
2020-12-05
Logstash之Grok正則匹配，讓正則進階！
2022-11-17
機器學習中的範數規則化之（一）L0、L1與L2範數
2018-04-12
機器學習
JavaScript正則學習筆記
2020-11-22
JavaScript筆記
神經網路最佳化篇：詳解正則化（Regularization）
2023-12-19
神經網路
COMP 330正則化邏輯迴歸分類
2024-04-02
邏輯迴歸

機器學習之簡化正則化:L2 正則化

圖 1.訓練集和驗證集損失

相關文章