機器學習實戰6(SMO演算法)
關於SVM的講解可以參閱《機器學習技法》的相關筆記:http://blog.csdn.net/u011239443/article/details/76572743
SMO演算法
實現
# -*- coding: utf-8 -*-
from numpy import *
# 載入資料
def loadDataSet(fileName):
dataMat = [];labelMat = []
fr = open(fileName)
for line in fr.readlines():
lineArr = line.strip().split('\t')
dataMat.append([float(lineArr[0]),float(lineArr[1])])
labelMat.append([float(lineArr[2])])
return dataMat,labelMat
# 從0到m中產生一個不為i的整數
def selectJrand(i,m):
j = i
while(j == i):
j = int(random.uniform(0,m))
return j
# 使得aj 在邊界值[L,H]以內
def clipAlpha(aj,H,L):
if aj > H:
aj = H
if L > aj:
aj = L
return aj
#SMO 序列最小優化
def smoSimple(dataMatIn,classLabels,C,toler,maxIter):
dataMat = mat(dataMatIn);labelMat = mat(classLabels).transpose();
b = 0;m,n = shape(dataMat)
alphas = mat(zeros((m,1)))
iter = 0
# alphaPairsChanged 用來更新的次數
# 當遍歷 連續無更新 maxIter 輪,則認為收斂,迭代結束
while iter < maxIter:
alphaPairsChanged = 0
for i in range(m):
# KKT 條件計算出
fXi = float(multiply(alphas,labelMat).T * (dataMat*dataMat[i,:].T))+b
# 誤差
Ei = fXi - float(labelMat[i])
# toler:容忍錯誤的程度
# labelMat[i]*Ei < -toler 則需要alphas[i]增大,但是不能>=C
# labelMat[i]*Ei > toler 則需要alphas[i]減小,但是不能<=0
if ((labelMat[i]*Ei < -toler) and (alphas[i] < C)) or ((labelMat[i]*Ei > toler) and (alphas[i] > 0)):
# 從0到m中產生一個不為i的整數
j = selectJrand(i,m)
fXj = float(multiply(alphas,labelMat).T * (dataMat*dataMat[j,:].T)+b)
Ej = fXj - float(labelMat[j])
alphaIold = alphas[i].copy()
alphaJold = alphas[j].copy()
# 演算法講解“二變數優化問題”部分
if labelMat[i] != labelMat[j]:
L = max(0,alphas[j]-alphas[i])
H = min(C,C+alphas[j]-alphas[i])
else:
L = max(0,alphas[j] + alphas[i] - C)
H = min(C,alphas[j] + alphas[i])
if L == H:print "L == H";continue
# 見式 7.107
eta = -2.0* dataMat[i,:] * dataMat[j,:].T + dataMat[i,:] *\
dataMat[i,:].T + dataMat[j,:] * dataMat[j,:].T
if eta <= 0:print "eta <= 0";continue
# 見式 7.106
alphas[j] += labelMat[j]*(Ei-Ej)/eta
# 見式 7.108 ,講alphas[j] 約束在 [L,H]
alphas[j] = clipAlpha(alphas[j],H,L)
if(abs(alphas[j] - alphaJold) < 0.00001):
print "j not moving"
# 見式 7.109
alphas[i] += labelMat[j]*labelMat[i]*(alphaJold-alphas[j])
# 見式 7.114
b1 = b - Ei -labelMat[i]*(alphas[i]-alphaIold)*dataMat[i,:]*dataMat[i,:].T\
- labelMat[j]*(alphas[j]-alphaJold)*dataMat[i,:]*dataMat[j,:].T
b2 = b - Ej - labelMat[i] * (alphas[i] - alphaIold) * dataMat[i, :] * dataMat[j, :].T \
- labelMat[j] * (alphas[j] - alphaJold) * dataMat[j, :] * dataMat[j, :].T
if (0 < alphas[i]) and (C > alphas[i]):
b = b1
elif (0 < alphas[j]) and (C > alphas[j]):
b = b2
else:
b = (b1+b2)/2.0
alphaPairsChanged += 演算法1
print "iter: %d i:%d pairs: %d" %(iter,i,alphaPairsChanged)
if alphaPairsChanged == 0:
iter += 1
else:
iter = 0
print "iter %d" %iter
return b,alphas
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
SOM背後的含義
我們來看下SVM的對偶問題:
沒錯,我們在不斷的調整alphas,其實就是在不斷的調整alpha來優化問題。
就如我們在《機器學習技法》中說的,無論是SVM 還是 PLA,w都是ynzn” role=”presentation” style=”position: relative;”>ynznynzn的組合,可以看成是由原始的資料表示出來的:
而有些資料中的記錄沒用,我們就將它的alpha調整為0,有用記錄 alpha > 0。所謂的有用的,也就是我們邊界上邊的點,即支援向量。
b:
[[-3.83903814]]
- 1
alphas[alphas>0],即支援向量所對應的alpha:
[[ 0.12744319 0.24145985 0.36890304]]
- 1
相關文章
- 支援向量機|SMO演算法實現演算法
- 《機器學習實戰》學習大綱機器學習
- 機器學習實戰筆記-k近鄰演算法機器學習筆記演算法
- 《機器學習_07_01_svm_硬間隔支援向量機與SMO》機器學習
- python機器學習實戰(二)Python機器學習
- 回顧·機器學習/深度學習工程實戰機器學習深度學習
- 《機器學習實戰》第一章 機器學習基礎機器學習
- 機器學習實戰----k值近鄰演算法(Python語言)機器學習演算法Python
- 機器學習實戰之Logistic迴歸機器學習
- 機器學習30天進階實戰機器學習
- 機器學習入門實戰疑問機器學習
- 機器學習實戰(十三):Convolutional Neural Networks機器學習
- 9.1.6 DBSCAN聚類演算法————機器學習實戰第二版聚類演算法機器學習
- 【機器學習】帶你3分鐘看完《機器學習實戰》總結篇機器學習
- 機器學習演算法機器學習演算法
- 【Python機器學習實戰】聚類演算法(1)——K-Means聚類Python機器學習聚類演算法
- 《scikit-learn機器學習實戰》簡介機器學習
- 機器學習實戰 | SKLearn最全應用指南機器學習
- 基於Sklearn機器學習程式碼實戰機器學習
- 機器學習實戰(一)—— 線性迴歸機器學習
- 面向機器智慧的TensorFlow實戰4:機器學習基礎機器學習
- 【Python機器學習實戰】決策樹和整合學習(一)Python機器學習
- 初學者的機器學習入門實戰教程!機器學習
- 機器學習演算法學習筆記機器學習演算法筆記
- 【資料科學系統學習】機器學習演算法 # 西瓜書學習記錄 [6] 樸素貝葉斯實踐資料科學機器學習演算法
- Spark機器學習實戰 (十一) - 文字情感分類專案實戰Spark機器學習
- 【機器學習】新手必看的十種機器學習演算法機器學習演算法
- 《機器學習實戰》-01機器學習基礎 #win8-anaconda prompt配置jupyter notebook機器學習
- Python學習6之簡單實戰Python
- 教你6步從頭寫機器學習演算法——以感知機演算法為例機器學習演算法
- 機器學習演算法:AdaBoost機器學習演算法
- Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記2 — 機器學習的主要挑戰機器學習筆記
- 【Python機器學習實戰】決策樹與整合學習(三)——整合學習(1)Python機器學習
- 【Python機器學習實戰】感知機和支援向量機學習筆記(三)之SVM的實現Python機器學習筆記
- 機器學習實踐篇第二篇-KNN演算法學習機器學習KNN演算法
- Python遷移學習:機器學習演算法Python遷移學習機器學習演算法
- 機器學習實戰-SVM模型實現人臉識別機器學習模型
- 從 0 開始機器學習 - 機器學習演算法診斷機器學習演算法