對數機率迴歸（邏輯迴歸）原理與Python實現

Egar發表於2021-01-10

原文網址 : https://www.cnblogs.com/violet-egar/p/14259190.html

一、對數機率和對數機率迴歸

在對數機率迴歸中，我們將樣本的模型輸出\(y^*\)定義為樣本為正例的概率，將\(\frac{y^*}{1-y^*}\)定義為機率（odds），機率表示的是樣本作為正例的相對可能性。將機率取對便可以得到對數機率（log odds，logit）。

\[logit=\log\frac{y^*}{1-y^*} \]

而對數機率迴歸（Logistic Regression）則試圖從樣本集中學得模型\(w^Tx\)並使其逼近該樣本的對數機率，從而可以得到：

\[condition1:w^Tx=\log\frac{y^*}{1-y^*} \]

二、Sigmoid函式

通過求解\(conditoin1\)可以得到：

\[y^*=\frac{e^{w^Tx}}{1+e^{w^Tx}}=\frac{1}{1+e^{-w^Tx}} \]

由此我們可以知道樣本\(x_i\)為正例的概率可以通過函式\(h(w^Tx_i)=\frac{1}{1+e^{-w^Tx_i}}\)來表示。而其中的函式\(h(z)\)便被稱為Sigmoid函式，其影像如下：

![](https://img2020.cnblogs.com/blog/1740641/202101/1740641-20210110191640063-801988894.png)

求其導數：

\[h'(z)=\frac{-e^{-z}}{(1+e^{-z})^2}=\frac{1}{1+e^{-z}}(1-\frac{1}{1+e^{-z}})=h(z)(1-h(z)) \]

這是一個很好的性質，有利於簡化後面優化模型時的計算。

三、極大似然法

通過前面的推導，可以得到：

\[P(y=1|x)=y^*=h(w^Tx)\,\,\,\,\,\,\,\,P(y=0|x)=1-y^*=1-h(w^Tx) \]

合併兩個式子，則有：

\[P(y|x)=h(w^Tx)^y(1-h(w^Tx))^{1-y} \]

求出了樣本標記的分佈律，便可以通過極大似然法來估計分佈律中的引數\(w\)。先寫出極大似然函式：

\[L(y_i|x_i,w)=\prod^{m}_{i=1}h(w^Tx_i)^{y_i}(1-h(w^Tx_i))^{1-{y_i}} \]

對極大似然函式取對可以得到對數似然函式：

\[l(y_i|x_i,w)=log(L)=\sum^{m}_{i=1}{(y_i\log h(w^Tx_i)+(1-y_i)log(1-h(w^Tx_i)))} \]

在前面乘上負數因子便可以得到對數機率迴歸的代價函式：

\[J(w)=-\frac{1}{m}\sum^{m}_{i=1}{(y_i\log h(w^Tx_i)+(1-y_i)log(1-h(w^Tx_i)))} \]

通過最小化上述代價函式便可以估計出引數\(w\)的值。

四、梯度下降法

通過上述步驟，優化對數機率迴歸模型的關鍵變成了求解：

\[w=\arg\min J(w)=\arg\min -\frac{1}{m}\sum^{m}_{i=1}{(y_i\log h(w^Tx_i)+(1-y_i)log(1-h(w^Tx_i)))} \]

在《線性迴歸：梯度下降法優化》中，我已經詳細介紹了梯度下降法的數學原理，這裡直接使用梯度下降法來對對數機率迴歸模型進行優化。
對\(J(w)\)進行求導：

\[\frac{\partial J}{\partial w}=-\frac{1}{m}\sum^{m}_{i=1}(y_i(1-h(w^Tx_i))x_i+(y_i-1)h(w^Tx_i)x_i)=-\frac{1}{m}\sum^{m}_{i=1}{(y_i-h(w^Tx_i))x_i} \]

將\(\frac{\partial J}{\partial w}\)帶入引數\(w\)的更新公式\(w^*=w-\eta\frac{\partial J}{\partial w}\)，最終得到\(w\)的更新公式如下：

\[w^*=w+\frac{\eta}{m}\sum^{m}_{i=1}{(y_i-h(w^Tx_i))x_i} \]

四、Python實現

梯度下降優化演算法：

    def fit(self, X, y):
        self.W = np.zeros(X.shape[1] + 1)
        for i in range(self.max_iter):
            delta = self._activation(self._linear_func(X)) - y
            self.W[0] -= self.eta * delta.sum()
            self.W[1:] -= self.eta * (delta @ X)
        return self

匯入鳶尾花資料集進行測試：

if __name__ == "__main__":
    from sklearn import datasets
    from sklearn.model_selection import train_test_split
    from sklearn.metrics import classification_report

    irirs = datasets.load_iris()
    X = irirs["data"][:100]
    y = irirs["target"][:100]
    X_train, X_test, y_train, y_test = train_test_split(X, y, train_size=0.7, test_size=0.3)
    classifier = LRClassifier().fit(X_train, y_train)
    y_pred = classifier.predict(X_test)
    print(classification_report(y_test, y_pred))

分類報告如下：

線性迴歸與邏輯迴歸
2019-07-08
邏輯迴歸
Python邏輯迴歸
2020-02-29
Python邏輯迴歸
機器學習 | 線性迴歸與邏輯迴歸
2020-09-23
機器學習邏輯迴歸
對比線性迴歸、邏輯迴歸和SVM
2018-08-13
邏輯迴歸
邏輯迴歸
2021-09-09
邏輯迴歸
邏輯迴歸演算法推理與實現
2022-06-07
邏輯迴歸演算法
邏輯迴歸模型
2024-09-05
邏輯迴歸模型
機器學習：邏輯迴歸
2024-12-02
機器學習邏輯迴歸
【小白學AI】線性迴歸與邏輯迴歸（似然引數估計）
2020-08-02
AI邏輯迴歸
機器學習之邏輯迴歸：計算機率
2020-06-21
機器學習邏輯迴歸計算機
邏輯迴歸（Logistic Regression）原理及推導
2019-02-22
邏輯迴歸
機器學習之邏輯迴歸
2019-01-22
機器學習邏輯迴歸
機器學習整理（邏輯迴歸）
2022-03-23
機器學習邏輯迴歸
數學推導+純Python實現機器學習演算法：邏輯迴歸
2019-03-03
Python機器學習演算法邏輯迴歸
機器學習之使用Python完成邏輯迴歸
2019-07-10
機器學習Python邏輯迴歸
邏輯迴歸演算法
2023-09-25
邏輯迴歸演算法
邏輯迴歸：使用Python的簡化方法
2018-09-24
邏輯迴歸Python
python實現線性迴歸之簡單迴歸
2020-04-29
Python
機器學習演算法--邏輯迴歸原理介紹
2021-12-05
機器學習演算法邏輯迴歸
邏輯迴歸損失函式
2018-04-10
邏輯迴歸函式
2.3 邏輯迴歸演算法
2019-12-31
邏輯迴歸演算法
4.邏輯迴歸（Logistic Regression）
2020-11-16
邏輯迴歸
Tensorflow教程（前三）——邏輯迴歸
2020-09-30
邏輯迴歸
【機器學習】求解邏輯迴歸引數（三種方法程式碼實現）
2018-06-08
機器學習邏輯迴歸
邏輯迴歸中的係數的意義
2018-11-27
邏輯迴歸
tf.keras實現邏輯迴歸和softmax多分類
2024-05-31
Keras邏輯迴歸
機器學習-邏輯迴歸：從技術原理到案例實戰
2023-12-06
機器學習邏輯迴歸
邏輯迴歸：損失函式與梯度下降
2018-04-10
邏輯迴歸函式梯度
人工智慧-機器學習-邏輯迴歸
2024-05-15
人工智慧機器學習邏輯迴歸
【機器學習基礎】邏輯迴歸——LogisticRegression
2021-10-20
機器學習邏輯迴歸
統計學習：邏輯迴歸與交叉熵損失（Pytorch實現）
2022-02-14
邏輯迴歸熵PyTorch
實驗11-使用keras完成邏輯迴歸
2024-04-27
Keras邏輯迴歸
機器學習（六）：迴歸分析——鳶尾花多變數回歸、邏輯迴歸三分類只用numpy，sigmoid、實現RANSAC 線性擬合
2023-04-13
機器學習變數邏輯迴歸Sigmoid
邏輯迴歸為什麼使用sigmod
2019-02-22
邏輯迴歸
2.3邏輯迴歸損失函式
2020-12-16
邏輯迴歸函式
【機器學習】邏輯迴歸過程推導
2019-02-15
機器學習邏輯迴歸
機器學習之邏輯迴歸：計算概率
2020-06-21
機器學習邏輯迴歸
機器學習之邏輯迴歸：模型訓練
2020-06-27
機器學習邏輯迴歸模型