手擼機器學習演算法 - 感知機

HoLoong發表於2021-06-11

原文網址 : https://www.cnblogs.com/helongBlog/p/14874578.html

機器學習演算法

感知機（Perceptron）是最最最簡單的機器學習演算法（分類），同時也是深度學習中神經元的基礎元件；

演算法介紹

感知機與邏輯迴歸、SVM類似的是同樣是構建一個分割超平面來實現對資料點的分類，不同點在於超平面的查詢過程更加的簡單粗暴，簡單介紹下它的演算法流程：

假設二分類線性可分問題，x為輸入特徵，y為輸出標籤，y取值為-1和+1；
隨機超平面變數，由超平面公式\(w*x+b\)，x為輸入資料點，不用管它，因此也就是w和b需要隨機初始化；
遍歷所有資料點，判斷該點在當前超平面下的分類是否準確，可以通過\(w*x_i+b\)與\(y_i\)的乘積來判斷，如果二者乘積大於0，說明二者符號一致，即分類正確，反之分類錯誤；
如果分類錯誤，則需要更新w和b，更新公式為：\(w=w+y_i*x_i\)，\(b=y_i+b\)，這個公式可以這樣理解，對於w來說，需要更新說明\(w*x_i+b\)與\(y_i\)的乘積小於0，假設\(y_i\)為-1，則\(w*x_i+b\)大於0，此時我們希望能減小\(w*x_i+b\)，此時\(w=w+y_i*x_i\)等價於\(w=w-x_i\)，因此滿足調整需求；
重複上述2，3，4步驟，直到所有點都分類正確為止；

程式碼實現

構建資料集

注意由於感知機只能處理線性可分的情況，因此下面資料集需要滿足線性可分，否則迭代過程無法終止；

X = np.array([[5,2], [3,2], [2,7], [1,4], [6,1], [4,5]])
Y = np.array([-1, -1, 1, 1, -1, 1])

隨機變數初始化

這裡的初始化值也是隨機的，對於w，由於輸入X是二維的，因此它也需要是二維的；

w,b = np.array([0, 0]),0

遍歷資料集及更新引數

run = True
while run:
    run = False
    for x,y in zip(X,Y):
        if y*(np.dot(w,x)+b)<=0:
            w,b = w+y*x,y+b
            run = True
            break

執行結果

完整程式碼

import numpy as np
import matplotlib.pyplot as plt

'''
感知機：線性二分類模型，擬合分割超平面對資料進行分類；
暴力實現：無腦針對每一個錯誤點進行w和b的更新，可以證明線上性可分情況下，有限次迭代可以完成劃分；
'''

# 初始化 w 和 b，np.array 相當於定義向量
w,b = np.array([0, 0]),0 

# 定義 d(x) 函式
def d(x):
    return np.dot(w,x)+b # np.dot 是向量的點積

# 歷史信用卡發行資料
# 這裡的資料集不能隨便修改，否則下面的暴力實現可能停不下來
X = np.array([[5,2], [3,2], [2,7], [1,4], [6,1], [4,5]])
Y = np.array([-1, -1, 1, 1, -1, 1])

run = True
while run:
    run = False
    for x,y in zip(X,Y):
        if y*d(x)<=0:
            w,b = w+y*x,y+b
            run = True
            break

print(w,b)

positive = [x for x,y in zip(X,Y) if y==1]
negative = [x for x,y in zip(X,Y) if y==-1]
line = [(-w[0]*x-b)/w[1] for x in [-100,100]]
plt.title('w='+str(w)+', b='+str(b))
plt.scatter([x[0] for x in positive],[x[1] for x in positive],c='green',marker='o')
plt.scatter([x[0] for x in negative],[x[1] for x in negative],c='red',marker='x')
plt.plot([-100,100],line,c='black')
plt.xlim(min([x[0] for x in X])-1,max([x[0] for x in X])+1)
plt.ylim(min([x[1] for x in X])-1,max([x[1] for x in X])+1)

plt.show()

最後

從演算法上看，感知機無疑是非常簡單的一種，但是它的訓練過程依然是完整的，因此作為機器學習入門演算法非常合適，尤其是在後續很多演算法甚至是深度學習中都能看到它的影子；

手擼機器學習演算法 - 嶺迴歸
2021-06-18
機器學習演算法
手擼機器學習演算法 - 邏輯迴歸
2021-06-24
機器學習演算法邏輯迴歸
手擼機器學習演算法 - 線性迴歸
2021-06-11
機器學習演算法
[python學習]機器學習 -- 感知機
2020-10-19
Python機器學習
手擼機器學習演算法 - 多項式迴歸
2021-06-17
機器學習演算法
手擼機器學習演算法 - 非線性問題
2021-06-15
機器學習演算法
教你6步從頭寫機器學習演算法——以感知機演算法為例
2018-11-16
機器學習演算法
SLAM +機器學習迎來了“感知時代”
2020-07-30
SLAM機器學習
機器學習演算法
2018-03-27
機器學習演算法
【機器學習】新手必看的十種機器學習演算法
2018-03-12
機器學習演算法
[深度學習]多層感知機（MLP）
2024-04-13
深度學習
【Python機器學習實戰】感知機和支援向量機學習筆記（三）之SVM的實現
2021-08-11
Python機器學習筆記
機器學習演算法：AdaBoost
2020-09-25
機器學習演算法
從 0 開始機器學習 - 機器學習演算法診斷
2020-07-16
機器學習演算法
機器學習演算法學習筆記
2023-03-13
機器學習演算法筆記
【機器學習】機器學習建立演算法第1篇：機器學習演算法課程定位、目標【附程式碼文件】
2024-03-11
機器學習演算法
統計學習方法筆記-感知機學習方法
2023-05-16
筆記
Python遷移學習：機器學習演算法
2020-12-16
Python遷移學習機器學習演算法
機器學習演算法一覽
2018-07-23
機器學習演算法
機器學習——梯度下降演算法
2019-07-24
機器學習梯度演算法
機器學習：整合演算法
2020-08-06
機器學習演算法
機器學習 10大演算法
2024-10-10
機器學習演算法
educoder 機器學習 --- kNN演算法
2024-07-01
機器學習KNN演算法
機器學習【模型，策略，演算法】
2024-11-27
機器學習模型演算法
【機器學習演算法】XGBoost原理
2024-11-30
機器學習演算法
【機器學習】機器學習簡介
2018-11-29
機器學習
機器學習--有監督學習--演算法整理
2024-06-07
機器學習演算法
python機器學習演算法——KNN演算法
2024-04-16
Python機器學習演算法KNN
機器學習——K近鄰演算法
2019-02-16
機器學習演算法
機器學習——貝葉斯演算法
2018-06-02
機器學習演算法
機器學習之整合演算法
2019-08-04
機器學習演算法
機器學習——KNN近鄰演算法
2020-11-04
機器學習KNN演算法
機器學習筆記（KNN演算法）
2021-07-02
機器學習筆記KNN演算法
【資源】機器學習演算法工程師手冊（PDF下載）
2018-10-14
機器學習演算法工程師
【機器學習】深度解析機器學習五大流派中主演算法精髓
2018-04-07
機器學習演算法
機器學習演算法：Logistic迴歸學習筆記
2018-05-29
機器學習演算法筆記
【機器學習】--Python機器學習庫之Numpy
2018-04-06
機器學習Python
大型機器學習【Coursera 史丹佛機器學習】
2021-09-09
機器學習