Logistic regression 為什麼用 sigmoid ?
假設我們有一個線性分類器:

我們要求得合適的 W ,使 0-1 loss 的期望值最小,即下面這個期望最小:

一對 x y 的 0-1 loss 為:

在資料集上的 0-1 loss 期望值為:

由 鏈式法則 將概率p變換如下:

為了最小化 R(h),只需要對每個 x 最小化它的 conditional risk:

由 0-1 loss 的定義,當 h(x)不等於 c 時,loss 為 1,否則為 0,所以上面變為:

又因為

所以:

為了使 條件風險 最小,就需要 p 最大,也就是需要 h 為:

上面的問題等價於 找到 c*,使右面的部分成立:

取 log :

在二分類問題中,上面則為:

即,我們得到了 log-odds ratio !
接下來就是對 log-odds ratio 進行建模,最簡單的就是想到線性模型:

則:

於是得到 sigmoid 函式:

由此可見,log-odds 是個很自然的選擇,sigmoid 是對 log-odds 的線性建模。
學習資料:
https://onionesquereality.wordpress.com/2016/05/18/where-does-the-sigmoid-in-logistic-regression-come-from/
https://stats.stackexchange.com/questions/162988/why-sigmoid-function-instead-of-anything-else
相關文章
- Machine Learning (6) - Logistic Regression (Binary Classification)Mac
- Machine Learning (8) - Logistic Regression (Multiclass Classification)Mac
- 4.邏輯迴歸(Logistic Regression)邏輯迴歸
- 邏輯迴歸(Logistic Regression)原理及推導邏輯迴歸
- 三、邏輯迴歸logistic regression——分類問題邏輯迴歸
- 【機器學習】Logistic Regression 的前世今生(理論篇)機器學習
- 【深度學習基礎-13】非線性迴歸 logistic regression深度學習
- Machine Learning (6) - 關於 Logistic Regression (Multiclass Classification) 的小練習Mac
- Machine Learning (7) - 關於 Logistic Regression (Binary Classification) 的小練習Mac
- Machine Learning (9) - 關於 Logistic Regression (Multiclass Classification) 的小練習Mac
- 人工神經外網路中為什麼ReLu要好過於Tanh和Sigmoid Function?SigmoidFunction
- 林軒田機器學習基石課程學習筆記10 — Logistic Regression機器學習筆記
- 林軒田機器學習技法課程學習筆記5 — Kernel Logistic Regression機器學習筆記
- 【淘汰9成NLP面試者的高頻面題】LSTM中的tanh和sigmoid分別用在什麼地方?為什麼?面試Sigmoid
- sigmoid啟用函式如何求導Sigmoid函式求導
- python為什麼用類Python
- 吳恩達機器學習課程:程式設計練習 | (2) ex2-logistic regression吳恩達機器學習程式設計
- 為什麼用Node.js?Node.js
- Logistic 迴歸-原理及應用
- 為什麼 JavaScript 的 this 要這麼用?JavaScript
- Python為什麼這麼火?學習python有什麼用?Python
- 學Flask框架有什麼用?為什麼學習Flask?Flask框架
- 人工智慧為什麼用Python?原因是什麼?人工智慧Python
- 為什麼用「void 0」代替「undefined」Undefined
- 為什麼看不見AHAS應用?
- 為什麼 SQLite 用 C 編寫?SQLite
- Linux為什麼受歡迎?學習Linux有什麼用?Linux
- PHP - 什麼是 PHP? 為什麼用 PHP? 有誰在用 PHP?PHP
- iOS應用加固為什麼也那麼重要?iOS
- 為什麼越來越少的人用jQueryjQuery
- 為什麼有些公司不讓用 Lombok ?Lombok
- 01神經網路和深度學習-Logistic-Regression-with-a-Neural-Network-mindset-第二週程式設計作業2神經網路深度學習程式設計
- Sigmoid函式總結Sigmoid函式
- 為什麼DRAM採用地址複用技術?為什麼SRAM不採用地址複用技術?
- 優惠券有什麼用,為什麼不直接降價呢?
- 什麼是網路爬蟲?為什麼用Python寫爬蟲?爬蟲Python
- GitHub:我們為什麼會棄用jQuery?GithubjQuery
- 開發Web應用為什麼要用TypeScript?WebTypeScript