學習SVM（二）如何理解支援向量機的最大分類間隔

步入量化學習艾莉絲發表於2019-03-01

原文網址 : https://flycode.co/archives/282617

SVM演算法在在1995年正式發表，在針對中小型資料規模的分類任務上有著卓越的效果，同時有著完整的理論證明，在20世紀末的幾年和21世紀初的10年完勝神經網路，吳恩達在其2003年的《Machien learning》公開課上用兩節課的時間對其進行講解，而神經網路講解了20min左右。就是這個演算法把神經網路按在地上摩擦了大概15年的時間，直到深度學習的興起。但即便這樣，現在SVM演算法依舊被廣泛的使用。

SVM大概的可以不確切的分為三個程度理解：

（1）線性可分情況下的線性分類器，這是最原始的SVM，它最核心的思想就是最大的分類間隔（margin maximization）；
（2）線性不可分情況下的線性分類器，引入了軟間隔（soft margin）的概念；
（3）線性不可分情況下的非線性分類器，是SVM與核函式（kernel function）的結合。
在下面只會第一部分的內容。

什麼是最大分類間隔

SVM最大分類間隔的靈感來自於一個非常符合直覺的觀察，如果存在兩類資料，資料的特徵是二維的，那麼我們就可以把資料畫在一個二維平面上，此時我想找到一個決策面（決策邊界）去將這兩類資料分開。如下圖所示：

學習SVM（二）如何理解支援向量機的最大分類間隔

理論上這個決策邊界有無數種選擇，就像圖中畫出的四條黑色的線，都能實現分類，但是哪一種是最好的分類方式呢？SVM演算法認為在上圖中靠近決策平邊界的點（正負樣本）與決策邊界的距離最大時，是最好的分類選擇：

學習SVM（二）如何理解支援向量機的最大分類間隔

上圖中紅色的線就是要優化的目標，它表徵了資料到決策邊界的距離，這個距離就是所謂的最大分類間隔。同時在上面的幾個資料，如果靠近兩側的資料少了幾個，也不會影響決策邊界的確定，而被紅色框框出來三個資料才決定了最終的決策邊界，所以這三個資料被稱之為支援向量。

線性分類器

支援向量機演算法如何實現最大分類間隔的任務呢？我們可以先從線性分類器開始理解它，支援向量在沒有引入核函式的時候就是一個線性的分類器，我們假設與決策邊界垂直的向量（決策面的法向量）為V：

學習SVM（二）如何理解支援向量機的最大分類間隔

黑色的線是假設的決策邊界，X1和X2是決策邊界兩側的兩個點，Xt1和Xt2是兩個點在法向量V上面的投影，那麼可以很直觀看到，原點到Xt1的距離<原點到Xt2的距離，而且可以推廣延伸到只要資料點在決策邊界的兩側，那麼在決策邊界左側的資料點在法向量上面的投影距離永遠比右側的距離短，這就是支援向量機實現分類預測的依據。那麼怎麼用公式表徵出這個點到直線投影的距離呢？
可以做這樣一個假設驗證一下：

學習SVM（二）如何理解支援向量機的最大分類間隔

如上圖中的情況所示：要求向量b在向量a上的投影距離d，向量的內積可以表示為：

學習SVM（二）如何理解支援向量機的最大分類間隔

於是角度的餘弦為：

學習SVM（二）如何理解支援向量機的最大分類間隔

距離d可以表示為：

學習SVM（二）如何理解支援向量機的最大分類間隔

而在SVM的特徵空間中，a是決策邊界的法向量，那麼a為單位法向量的時候其模為1，所以就有：

學習SVM（二）如何理解支援向量機的最大分類間隔

最後我們把a和b換成上面設定的值就會有：

學習SVM（二）如何理解支援向量機的最大分類間隔

有了這個東西，我們總能找到一個常數C分開兩類資料，也就是說：

學習SVM（二）如何理解支援向量機的最大分類間隔

到了上面的公式後，問題就非常的清晰了，法向量V其實就是決策邊界的係數（這是解析幾何裡面的知識），那麼大家肯定見過一種和它非常像的公式，叫做樣本空間下的超平面線性方程：

學習SVM（二）如何理解支援向量機的最大分類間隔

線性分類器就是這個樣子！！！
不經過sigmoid函式的Logistic模型也是這個樣子！！
不啟用的神經網路中的單個神經元還是這個樣子！！

如何實現最大分類間隔

從上面可以看到，此時的支援向量機（沒有加核函式）就是個線性的分類器，它的卓越效能就體現在線上性分類器基礎上的最大分類間隔。
所以本質上SVM要訓練的引數只有w和b，關鍵就在於SVM如何在優化中體現最大分類間隔的思想！
針對所有的訓練資料（traindata），SVM都希望：

學習SVM（二）如何理解支援向量機的最大分類間隔

這裡的正負1就體現的最大分類間隔，這裡是選擇用正負1是為了計算方便，因為無論間隔是多少，都可以依靠伸縮w和b約為1。上述公式就是SVM的最大間隔假設。如下圖：

學習SVM（二）如何理解支援向量機的最大分類間隔

在這個圖中，決策邊界兩邊的線之間的距離（最大間隔）為：

學習SVM（二）如何理解支援向量機的最大分類間隔

它是這樣求出來的，資料中的支援向量在影響著最大間隔，那麼假設兩個支援向量x1和x2分別為正負，最大間隔就應該是x2-x1在法向量上的投影：

學習SVM（二）如何理解支援向量機的最大分類間隔

所以求取d的過程為：

學習SVM（二）如何理解支援向量機的最大分類間隔

學習SVM（二）如何理解支援向量機的最大分類間隔

這就是SVM的優化目標，它想要找到max(d)，然後大家可能發現了，這個目標裡面沒有b，之和w有關，那麼是不是任意的b都可以呢？
顯然不是的，這個優化有一個約束條件，因為推導的過程就有假設條件是兩個支援向量要求在兩側，所以這個約束條件可以寫成：

學習SVM（二）如何理解支援向量機的最大分類間隔

所以最終的目標為：

學習SVM（二）如何理解支援向量機的最大分類間隔

或者為：

學習SVM（二）如何理解支援向量機的最大分類間隔

需要注意的是，約束條件中的i=1…….n，n為樣本的個數。

相關閱讀：學習SVM（三）理解SVM中的對偶問題

相關文章

支援向量機 (二)：軟間隔 svm 與核函式
2019-07-01
函式
《機器學習_07_01_svm_硬間隔支援向量機與SMO》
2020-05-20
機器學習
學習SVM（四）理解SVM中的支援向量（Support Vector）
2018-09-06
機器學習——支援向量機（SVM）
2018-05-28
機器學習
機器學習：支援向量機(SVM)
2020-08-17
機器學習
機器學習之支援向量與間隔
2020-07-04
機器學習
機器學習——支援向量機SVM（一）
2018-12-08
機器學習
機器學習(四)：通俗理解支援向量機SVM及程式碼實踐
2021-02-15
機器學習
人工智慧-機器學習-支援向量機SVM
2024-05-17
人工智慧機器學習
支援向量機（SVM）
2023-09-26
機器學習基礎專題：支援向量機SVM
2020-10-18
機器學習
分類演算法-支援向量機 SVM
2020-01-19
演算法
支援向量機（SVM）和python實現（二）
2021-09-09
Python
SVM——支援向量機（完整）
2020-05-25
SVM_支援向量機
2020-11-04
【機器學習】支援向量機分類
2022-07-13
機器學習
[譯] 支援向量機（SVM）教程
2018-12-13
對SVM支援向量機（1）
2020-10-26
感知機與支援向量機 (SVM)
2021-06-24
機器學習演算法筆記之5：支援向量機SVM
2020-04-06
機器學習演算法筆記
支援向量機（Support Vector Machine，SVM）——　線性SVM
2018-12-28
Mac
機器學習基礎篇：支援向量機（SVM）理論與實踐
2021-08-20
機器學習
支援向量機(SVM)之硬閾值
2021-06-24
【Python機器學習實戰】感知機和支援向量機學習筆記（三）之SVM的實現
2021-08-11
Python機器學習筆記
機器學習，詳解SVM軟間隔與對偶問題
2020-09-09
機器學習
《機器學習_07_03_svm_核函式與非線性支援向量機》
2020-05-21
機器學習函式
支援向量機SVM：從數學原理到實際應用
2023-11-18
OpenCV筆記（3）實現支援向量機（SVM）
2018-04-11
OpenCV筆記
演算法金 | 再見，支援向量機 SVM！
2024-05-29
演算法
SVM 支援向量機演算法-實戰篇
2021-01-22
演算法
SVM 支援向量機演算法-原理篇
2021-01-20
演算法
機器學習之-搞定支援向量機（SVM）【人工智慧工程師--AI轉型必修課】
2020-04-04
機器學習人工智慧工程師AI
深入理解SVM，軟間隔與對偶問題
2020-09-03
機器學習之支援向量機的超平面
2020-07-04
機器學習
監督學習之支援向量機
2020-02-14
學習SVM（五）理解線性SVM的鬆弛因子
2018-09-10
支援向量機（SVM）從原理到python程式碼實現
2020-12-10
Python
有監督學習——支援向量機、樸素貝葉斯分類
2023-03-15