本身是一個二值器

　　SVM演算法最初是為二值分類問題設計的，當處理多類問題時，就需要構造合適的多類分類器。

　　目前，構造SVM多類分類器的方法主要有兩類

　　（1）直接法，直接在目標函式上進行修改，將多個分類面的引數求解合併到一個最最佳化問題中，透過求解該最最佳化問題“一次性” 多類分類。這種方法看似簡單，但其計算複雜度比較高，實現起來比較困難，只適合用於小型問題中；

　　（2）間接法，主要是透過組合多個二分類器來實現多分類器的構造，常見的方法有one-against-one和one-against-all兩種。

一對多法（one-versus-rest,簡稱OVR SVMs）

　　訓練時依次把某個類別的樣本歸為一類,其他剩餘的樣本歸為另一類，這樣k個類別的樣本就構造出了k個SVM。分類時將未知樣本分類為具有最大分類函式值的那類。

　　假如我有四類要劃分（也就是4個Label），他們是A、B、C、D。

　　於是我在抽取訓練集的時候，分別抽取

　　（1）A所對應的向量作為正集，B，C，D所對應的向量作為負集；

　　（2）B所對應的向量作為正集，A，C，D所對應的向量作為負集；

　　（3）C所對應的向量作為正集，A，B，D所對應的向量作為負集；

　　（4）D所對應的向量作為正集，A，B，C所對應的向量作為負集；

　　使用這四個訓練集分別進行訓練，然後的得到四個訓練結果檔案。

　　在測試的時候，把對應的測試向量分別利用這四個訓練結果檔案進行測試。

　　最後每個測試都有一個結果f1(x),f2(x),f3(x),f4(x)。

　　於是最終的結果便是這四個值中最大的一個作為分類結果。

評價：

　　這種方法有種缺陷,因為訓練集是1:M,這種情況下存在biased.因而不是很實用。可以在抽取資料集的時候，從完整的負集中再抽取三分之一作為訓練負集。

一對一法（one-versus-one,簡稱OVO SVMs或者pairwise）

　　其做法是在任意兩類樣本之間設計一個SVM，因此k個類別的樣本就需要設計k(k-1)/2個SVM。

　　當對一個未知樣本進行分類時，最後得票最多的類別即為該未知樣本的類別。

　　Libsvm中的多類分類就是根據這個方法實現的。

　　假設有四類A,B,C,D四類。在訓練的時候我選擇A,B; A,C; A,D; B,C; B,D;C,D所對應的向量作為訓練集，然後得到六個訓練結果，在測試的時候，把對應的向量分別對六個結果進行測試，然後採取投票形式，最後得到一組結果。

　　投票是這樣的：
　　A=B=C=D=0;
　　(A,B)-classifier 如果是A win,則A=A+1;otherwise,B=B+1;
　　(A,C)-classifier 如果是A win,則A=A+1;otherwise, C=C+1;
　　...
　　(C,D)-classifier 如果是A win,則C=C+1;otherwise,D=D+1;
　　The decision is the Max(A,B,C,D)

評價：這種方法雖然好,但是當類別很多的時候,model的個數是n*(n-1)/2,代價還是相當大的。

層次支援向量機

層次分類法首先將所有類別分成兩個子類，再將子類進一步劃分成兩個次級子類，如此迴圈，直到得到一個單獨的類別為止。對層次支援向量機的詳細說明可以參考論文《支援向量機在多類分類問題中的推廣》（劉志剛，計算機工程與應用，2004）

SVM實現多分類的三種方案

相關文章