正則化

Abyss_J發表於2023-04-06

原文網址 : https://www.cnblogs.com/abyss-130/p/17293042.html

一、正則化
1、正則化的理解
當模型的複雜度>>資料的複雜度時，會出現過擬合現象，即模型過度擬合了訓練資料，其泛化能力變差。為此，會透過資料增強、降維、正則化等方法防止模型過擬合。
從數學角度理解，以線性迴歸為例，其損失函式為：

\[\mathcal{L}(\omega) = \sum^{N}_{i=1}||\omega^T -y_i||^2 \]

可以得到：

\[W = (X^TX)^{-1}X^TY \]

需要對$X^TX$求逆，才能得到解。

對於$X_{N \times P}$，$x_i \in \mathbb{R}^P$，其中$N$為樣本數，$P$為樣本維度。當$P>>N$時，在數學上的表現為$X^TX$不可逆，在現象上，即為模型過擬合。

若以$L2$正則化方法進行約束，則有：

\[\begin{aligned} J(\omega) &=\sum^{N}_{i=1}||\omega^T -y_i||^2 +\lambda W^TW \\ &=(W^TX^T-Y^T)(XW-Y) + \lambda W^TW \\ &=W^TX^TXW -W^TX^TY-Y^TXW+YY^T+\lambda W^TW \\ &=W^TX^TXW-2W^TX^TY+Y^TY+\lambda W^TW \\ &=W^T(X^TX+\lambda I)W - 2W^TX^TY+Y^TY \end{aligned}\]

求導：

\[\begin{aligned} \frac{\partial J(\omega)}{\partial \omega} = 2(X^TX+\lambda I)W -2X^TY \end{aligned} \]

解得：

\[\begin{aligned} W = (X^TX+\lambda I)^{-1}X^TY \end{aligned}\]

$X^TX$為半正定矩陣，$\lambda I$為半形矩陣，故$(X^TX+\lambda I)$一定可逆，這從數學上解釋了正則化的原因。

2、TODO
......

機器學習之簡化正則化:L2 正則化
2020-06-20
機器學習
正則化詳解
2021-01-10
機器學習之稀疏性正則化：L1 正則化
2020-06-28
機器學習
「機器學習速成」稀疏性正則化：L1正則化
2019-06-24
機器學習
深度學習——正則化
2022-01-25
深度學習
正則化與模型選擇
2019-01-25
模型
正則化是幹嘛的
2024-03-09
js表情正則手機正則郵箱正則
2020-12-16
JS
正則
2024-04-10
機器學習之簡化正則化：Lambda
2020-06-21
機器學習
10-正則化項-權重衰退
2024-08-24
【python介面自動化】- 正則用例引數化
2021-02-21
Python
正則_9
2018-06-04
正則?=用法
2018-08-03
正則 ?= 用法
2018-09-04
「python」正則
2018-08-08
Python
正則re
2024-03-10
Javascript正則
2019-08-04
JavaScript
py 正則
2020-12-08
正則匹配規則2
2024-04-19
基於正則化的多工聯邦
2024-09-29
7、超引數除錯、Batch正則化
2024-10-01
除錯BAT
從線性迴歸來理解正則化
2021-06-21
原理解析-過擬合與正則化
2020-12-05
Logstash之Grok正則匹配，讓正則進階！
2022-11-17
正則匹配規則記錄
2018-07-08
Java處理正則匹配卡死（正則回溯問題）
2023-03-01
Java
COMP 330正則化邏輯迴歸分類
2024-04-02
邏輯迴歸
js實現【JSON格式化】——方式1：正則
2020-03-08
JSON
正則請教
2023-12-18
正則-元字元
2020-10-18
字元
Python正則部分
2020-11-16
Python
正則雜談
2024-06-03
javascript 常用正則
2021-09-09
JavaScript
正則筆記
2021-04-25
筆記
神經網路最佳化篇：詳解正則化（Regularization）
2023-12-19
神經網路
JTCR-正則、反射和文字格式化-24 (end)
2024-04-24
反射
【scikit-learn基礎】--『預處理』之正則化
2023-12-18

正則化

相關文章