邏輯迴歸損失函式

夜空中最亮的不咚發表於2018-04-10

原文網址 : https://juejin.im/post/5acc60876fb9a028d043c3c7

邏輯迴歸函式

機器學習分為有監督學習，無監督學習，半監督學習，強化學習。對於邏輯迴歸來說，就是一種典型的有監督學習。

既然是有監督學習，訓練集自然可以用如下方式表述：

{(x1,y1),(x2,y2),⋯,(xm,ym)}

對於這m個訓練樣本，每個樣本本身有n維特徵。再加上一個偏置項x0, 則每個樣本包含n+1維特徵：

x=[x0,x1,x2,⋯,xn]T

其中 x∈Rn+1, x0=1, y∈{0,1}

李航博士在統計學習方法一書中給分類問題做了如下定義：
分類是監督學習的一個核心問題，在監督學習中，當輸出變數Y取有限個離散值時，預測問題便成為分類問題。這時，輸入變數X可以是離散的，也可以是連續的。監督學習從資料中學習一個分類模型或分類決策函式，稱為分類器(classifier)。分類器對新的輸入進行輸出的預測(prediction)，稱為分類(classification).

在logistic迴歸詳解一(blog.csdn.net/bitcarmanle…）中，我們花了一整篇篇幅闡述了為什麼要使用logistic函式:

hθ(x)=g(θTx)=11+e−θTx

其中一個重要的原因，就是要將Hypothesis(NG課程裡的說法)的輸出對映到0與1之間，既：

0≤hθ(x)≤1

同樣是李航博士統計學習方法一書中，有以下描述：
統計學習方法都是由模型，策略，和演算法構成的，即統計學習方法由三要素構成，可以簡單表示為：

方法=模型+策略+演算法

對於logistic迴歸來說，模型自然就是logistic迴歸，策略最常用的方法是用一個損失函式(loss function)或代價函式(cost function)來度量預測錯誤程度，演算法則是求解過程，後期會詳細描述相關的優化演算法。

logistic函式求導

g′(z)=ddz11+e−z=1(1+e−z)2(e−z)=1(1+e−z)⋅(1−1(1+e−z))=g(z)(1−g(z))

此求導公式在後續推導中會使用到

常見的損失函式

機器學習或者統計機器學習常見的損失函式如下：

1.0-1損失函式（0-1 loss function）

L(Y,f(X))={1,0,Y ≠ f(X)Y = f(X)

2.平方損失函式（quadratic loss function)

L(Y,f(X))=(Y−f(x))2

3.絕對值損失函式(absolute loss function)

L(Y,f(x))=|Y−f(X)|

4.對數損失函式（logarithmic loss function) 或對數似然損失函式(log-likehood loss function)

L(Y,P(Y|X))=−logP(Y|X)

邏輯迴歸中，採用的則是對數損失函式。如果損失函式越小，表示模型越好。

說說對數損失函式與平方損失函式

在邏輯迴歸的推導中國，我們假設樣本是服從伯努利分佈(0-1分佈)的，然後求得滿足該分佈的似然函式，最終求該似然函式的極大值。整體的思想就是求極大似然函式的思想。而取對數，只是為了方便我們的在求MLE(Maximum Likelihood Estimation)過程中採取的一種數學手段而已。

損失函式詳解

根據上面的內容，我們可以得到邏輯迴歸的對數似然損失函式cost function：

cost(hθ(x),y)={−log(hθ(x))−log(1−hθ(x))if y=1if y=0

稍微解釋下這個損失函式，或者說解釋下對數似然損失函式：
當y=1時，假定這個樣本為正類。如果此時hθ(x)=1,則單對這個樣本而言的cost=0,表示這個樣本的預測完全準確。那如果所有樣本都預測準確，總的cost=0
但是如果此時預測的概率hθ(x)=0，那麼cost→∞。直觀解釋的話，由於此時樣本為一個正樣本，但是預測的結果P(y=1|x;θ)=0, 也就是說預測 y=1的概率為0，那麼此時就要對損失函式加一個很大的懲罰項。
當y=0時，推理過程跟上述完全一致，不再累贅。

將以上兩個表示式合併為一個，則單個樣本的損失函式可以描述為：

cost(hθ(x),y)=−yilog(hθ(x))−(1−yi)log(1−hθ(x))

因為 yi 只有兩種取值情況，1或0，分別令y=1或y=0，即可得到原來的分段表示式。

全體樣本的損失函式可以表示為：

cost(hθ(x),y)=∑i=1m−yilog(hθ(x))−(1−yi)log(1−hθ(x))

這就是邏輯迴歸最終的損失函式表示式

2.3邏輯迴歸損失函式
2020-12-16
邏輯迴歸函式
邏輯迴歸損失函式(cost function)
2018-04-10
邏輯迴歸函式Function
邏輯迴歸：損失函式與梯度下降
2018-04-10
邏輯迴歸函式梯度
統計學習：邏輯迴歸與交叉熵損失（Pytorch實現）
2022-02-14
邏輯迴歸熵PyTorch
邏輯迴歸
2021-09-09
邏輯迴歸
Python邏輯迴歸
2020-02-29
Python邏輯迴歸
邏輯迴歸模型
2024-09-05
邏輯迴歸模型
線性迴歸與邏輯迴歸
2019-07-08
邏輯迴歸
大白話5分鐘帶你走進人工智慧-第十七節邏輯迴歸之交叉熵損失函式概念(2)
2019-04-29
人工智慧邏輯迴歸熵函式
損失函式
2020-11-27
函式
邏輯迴歸演算法
2023-09-25
邏輯迴歸演算法
對比線性迴歸、邏輯迴歸和SVM
2018-08-13
邏輯迴歸
機器學習從業者必知的5種迴歸損失函式
2019-03-03
機器學習函式
大白話5分鐘帶你走進人工智慧-第十八節邏輯迴歸之交叉熵損失函式梯度求解過程(3)
2019-04-30
人工智慧邏輯迴歸熵函式梯度
機器學習 | 線性迴歸與邏輯迴歸
2020-09-23
機器學習邏輯迴歸
線性迴歸，邏輯迴歸的學習（包含最小二乘法及極大似然函式等）
2018-03-27
邏輯迴歸函式
2.3 邏輯迴歸演算法
2019-12-31
邏輯迴歸演算法
4.邏輯迴歸（Logistic Regression）
2020-11-16
邏輯迴歸
Tensorflow教程（前三）——邏輯迴歸
2020-09-30
邏輯迴歸
機器學習：邏輯迴歸
2024-12-02
機器學習邏輯迴歸
3D高斯損失函式（1）單純損失函式
2024-06-28
3D函式
機器學習大牛最常用的5個迴歸損失函式，你知道幾個？
2018-06-21
機器學習函式
邏輯迴歸為什麼使用sigmod
2019-02-22
邏輯迴歸
機器學習之邏輯迴歸
2019-01-22
機器學習邏輯迴歸
機器學習整理（邏輯迴歸）
2022-03-23
機器學習邏輯迴歸
損失函式綜述
2018-05-06
函式
Triplet Loss 損失函式
2018-04-23
函式
Pytorch 常用損失函式
2020-11-26
PyTorch函式
對數機率迴歸（邏輯迴歸）原理與Python實現
2021-01-10
邏輯迴歸Python
邏輯迴歸（Logistic Regression）原理及推導
2019-02-22
邏輯迴歸
從零開始學習邏輯迴歸
2018-11-23
邏輯迴歸
邏輯迴歸：使用Python的簡化方法
2018-09-24
邏輯迴歸Python
例項解釋NLLLoss損失函式與CrossEntropyLoss損失函式的關係
2022-07-18
函式ROS
不求甚解的深度學習教程(1)-邏輯迴歸基本概念以及代價函式
2021-03-16
深度學習邏輯迴歸函式
PyTorch：損失函式loss function
2020-10-21
PyTorch函式Function
Pytorch中的損失函式
2020-10-22
PyTorch函式
TensorFlow損失函式專題
2020-04-06
函式
DDMP中的損失函式
2024-06-16
函式