AI面試之SVM推導

忽逢桃林發表於2020-07-22

AI面試

SVM現在主流的有兩個方法。一個是傳統的推導，計算支援向量求解的方法，一個是近幾年興起的梯度下降的方法。梯度下降方法的核心是使用了hinge loss作為損失函式，所以最近也有人提出的深度SVM其實就是使用hinge loss的神經網路。

本文的目的是講解傳統的推導。

SVM的超平面

SVM模型的基本原理，就是尋找一個合適的超平面，把兩類的樣本正確分開。單個SVM只能處理二分類，多分類需要多個SVM。

【什麼是超平面？】
超平面就是n維度空間的n-1維度的子空間。換成人話就是2維空間中的1維度的線，三維立體空間的二維平面。

圖中總共有5個超平面，那麼哪一個是最好的呢？我們認為中間的那個是最好的。因為他對兩側的間隔較大。

SVM基本型

超平面我們可以用這個方程來表示：
\(\bm{w^Tx}+b=0\)

空間中任意一個點x到這個超平面的垂直距離為：
\(d = \frac{|\bm{w^Tx}+b|}{||\bm{w}||}\)

這裡不得不提到一下邏輯迴歸，對於邏輯迴歸來說：

就是在超平面一側的樣本，邏輯迴歸給出的預測類別是1，另外一側就是0.

但是SVM覺得這樣有一些過於絕對了，所以：

不僅僅要一個樣本在平面的一側，還要在平面的這一側足夠遠的地方，才能算作某一類的樣本。

從圖中可以看到，兩條虛線之外的點，才是SVM能確定是正樣本還是負樣本的點。

【什麼是支援向量？】
圖中距離超平面最近的幾個訓練樣本，並且這幾個訓練樣本可以讓上式的等號成立。這個點就是支援向量。

【什麼是SVM的間隔】
兩個不同類別的支援向量到超平面的最小距離之和。其實也就是\(\frac{2}{||w||}\)

到這裡，我們可以隱隱約約的發現，尋找最優的超平面其實等價於尋找一個最大的間隔，或者說讓間隔最大化。所以可以得到：
\(\max_{w,b} \frac{2}{||\bm{w}||}\)
這個的約束條件就是：讓SVM給正樣本的打分大於1，給負樣本的打分小於-1,也就是：

簡化一下這個約束條件，可以得到：
\(y_i(\bm{w^Tx_i}+b)>=1\)

一般我們都是求取最小化問題，所以把最大化max問題取倒數，變成最小化問題：
\(\min_{w,b} \frac{||\bm{w}||}{2}\)
這裡為了後續的計算方便，最小化\(||w||\)等價於最小化\(||w||^2\),所以得到：
\(\min_{w,b} \frac{||\bm{w}||^2}{2}\)

總之SVM的基本型就是:

SVM求解

現在求得了基本型。現在可以來進一步優化這個最小化問題。但是首當其衝的問題便是，如何處理這個約束條件。這裡用到的方法是拉格朗日乘子法。將約束條件以\(\alpha_i\)的權重加入到優化問題中，所以可以得到：
\(Loss(\bm{w},b,\bm{\alpha})=\frac{1}{2}||w||^2+\sum^m_{i=1}\alpha_i(1-y_i(w^Tx_i+b))\)

這裡的loss就是我們要最小化的物件；
這裡的m就是支援向量的數量。

為了最小化這個問題，對w和b求偏導數，可以得到：
\(w = \sum^m_{i=1}{\alpha_iy_ix_i}\)
\(0 = \sum^m_{i=1}{\alpha_iy_i}\)

然後把這兩個公式代入到：
\(Loss(\bm{w},b,\bm{\alpha})=\frac{1}{2}||w||^2+\sum^m_{i=1}\alpha_i(1-y_i(w^Tx_i+b))\)

可以消掉w和b，得到：

約束條件為：

從而根據這個計算出\(\alpha_i\)的取值，然後得到w和b的取值。

【到底如何求解\(\alpha\)?】
上面說的最後一部求解alpha，都是理論可以求解，但是實際中如何做到呢？其實這裡如何求解\(\alpha\)要用到另外一個條件。

就是上述過程要滿足一個叫做KKT的條件（KKT具體是什麼有點複雜，就不多說了）：

想要第三個公式成立，要麼\(\alpha_i\)等於0，要麼\(y_if(x_i)-1=0\).如果alpha=0，那麼意味著這個樣本不是支援向量，不應該對SVM超平面起到任何影響，所以是不可能的。所以只有\(y_if(x_i)-1=0\)。

加上了這個條件，我們可以求解出來\(\alpha_i\)的具體數值，然後求解w和b的數值。

假設有3個支援向量，那麼就會有三個\(\alpha_1, \alpha_2, \alpha_3\) ,然後根據\(y_if(x_i)-1=0\)可以列出3個關於\(\alpha_1,\alpha_2,\alpha_3\)的三元一次方程組，然後得到唯一解。

機器學習 | 深入SVM原理及模型推導（一）
2020-08-26
機器學習模型
iOS面試準備之思維導圖
2018-11-28
iOS面試
JAVA面試輔導(包筆試面試代面)
2024-04-20
Java面試筆試
PHP面試常考內容之物件導向（3）
2019-02-14
PHP面試物件
SSH面試和筆試指導
2020-04-04
面試筆試
Go Quiz: 從Go面試題看數值型別的自動推導
2022-06-05
GoUI面試題型別
開心檔之python 推導式
2023-02-24
Python
Python推導式（列表推導式、元組推導式、字典推導式和集合推導式)
2020-09-24
Python
AI面試屆的“Chatgpt”——AI得賢招聘官來教您如何高效面試
2023-03-31
AI面試ChatGPT
AI面試題（持續更新）
2020-11-09
AI面試題
iOS面試之@property
2019-03-02
iOS面試
Runtime面試之weak
2019-04-21
面試
昨天面試之CSS
2019-02-20
面試CSS
面試之TCP/IP
2020-12-21
面試TCP
java物件導向的面試題
2019-03-18
Java物件面試題
一、Java物件導向面試題
2020-11-17
Java物件面試題
2-Java面試-物件導向
2020-10-11
Java面試物件
與面試官談笑風生 | Python物件導向之訪問控制
2019-03-04
面試Python物件
【小白學AI】XGBoost推導詳解與牛頓法
2020-08-24
AI
【小白學AI】XGBoost 推導詳解與牛頓法
2020-08-10
AI
名校AI課推薦 | UC Berkeley《人工智慧導論》
2022-06-21
AI人工智慧
常見AI面試題及答案
2019-02-20
AI面試題
想去Google做AI？先看完這套面試指南（附面試題）
2018-04-18
GoAI面試題
SVM之不一樣的視角
2020-04-26
支援向量機(SVM)之硬閾值
2021-06-24
脈脈App引導頁面中推薦功能的實現推測
2019-01-03
APP
Python學習筆記|Python之推導式
2018-12-21
Python筆記
推薦一份 Google 面試指南
2019-02-13
Go面試
CodeKarle：推特系統設計面試
2022-01-27
面試
22、Python 字典推導與集合推導
2020-12-28
Python
面試之負載均衡
2019-03-12
面試負載
面試之 Memcache 相關
2019-03-12
面試
面向面試之 HTML 篇
2019-04-06
面試HTML
面向面試之 CSS 篇
2019-04-06
面試CSS
面試精選之Promise
2018-06-26
面試Promise
面試之道之效能篇
2019-09-16
面試
面試必問之ArrayList
2019-08-01
面試
面試必問之MVC
2019-07-12
面試MVC

AI面試之SVM推導

SVM的超平面

SVM基本型

SVM求解

相關文章