通俗易懂講解ML中的均方誤差 (MSE) - haltakov

banq發表於2021-11-20

均方誤差 (MSE)是用來測量預測值Ŷ與某些真實值匹配程度。MSE 通常用作迴歸問題的損失函式。例如,根據其屬性估算公寓的價格。
 

詳細公式解釋
均方誤差公式可以寫成如下,它代表了一個非常簡單的概念,但如果您剛開始使用 ML,可能不太容易讀懂。

通俗易懂講解ML中的均方誤差 (MSE) - haltakov
誤差被定義為預測值Ŷ和一些真實值之間的差異Y。例如,如果您要預測房價,則誤差可能是預測價格與實際價格之間的差異。

通俗易懂講解ML中的均方誤差 (MSE) - haltakov
從標籤中減去預測是行不通的。誤差可能為負也可能為正,這是對樣本求和時的問題。想象一下你對兩套房子價格的預測是這樣的:

  • House 1:實際 120K,預測 100K -> 錯誤 20K
  • House 2:實際 60K,預測 80K -> 誤差 -20K

如果你總結這些錯誤將是 0,這顯然是錯誤的。要解決這個問題,您可以取絕對值或誤差的平方。正方形有一個特性,它懲罰更大的錯誤更多。使用絕對值將為我們提供另一個流行的公式 - 平均絕對誤差。

通俗易懂講解ML中的均方誤差 (MSE) - haltakov
我們通常計算多個樣本的誤差(在我們的例子中 - 房屋)。這是訓練機器學習模型時的典型情況 - 您的批次中將有許多樣本。我們需要計算每一個的誤差並求和。同樣,在這裡讓誤差始終≥ 0 很重要。

通俗易懂講解ML中的均方誤差 (MSE) - haltakov
如果要比較不同大小批次的誤差,則需要對樣本數量進行歸一化——取平均值。例如,您可能想檢視哪個批次大小產生的誤差較小。

通俗易懂講解ML中的均方誤差 (MSE) - haltakov
現在應該更容易理解公式了!MSE 是 ML 迴歸模型(例如線性迴歸)中常用的統計度量和損失函式。您還應該檢視平均絕對誤差 (MAE),它可以更好地處理異常值。

通俗易懂講解ML中的均方誤差 (MSE) - haltakov

相關文章