感知機演算法（PLA）程式碼實現

Alex發表於2020-07-22

原文網址 : https://www.cnblogs.com/liangjianli/p/13358384.html

1. 引言

在這裡主要實現感知機演算法（PLA）的以下幾種情況：

PLA演算法的原始形式（二分類）
PLA演算法的對偶形式（二分類）
PLA演算法的作圖（二維）
PLA演算法的多分類情況（包括one vs. rest 和one vs. one 兩種情況）
PLA演算法的sklearn實現

為了方便起見，使用鳶尾花資料集進行PLA演算法的驗證。

2. 載入庫和資料處理

# 載入庫
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Perceptron
import warnings
warnings.filterwarnings("ignore")

# 設定圖形尺寸
plt.rcParams["figure.figsize"] = [14, 7]
plt.rcParams["font.size"] = 14

# 載入鳶尾花資料集
iris_data = load_iris()
xdata = iris_data["data"]
ydata = iris_data["target"]

3. 感知機的原始形式

感知機的詳細原理見我的前一篇部落格

class model_perceptron(object):
    """
    功能：實現感知機演算法
    引數 w：權重，預設都為None
    引數 b：偏置項，預設為0
    引數 alpha：學習率，預設為0.001
    引數 iter_epoch：迭代輪數，預設最大為1000
    """
    def __init__(self, w = None, b = 0, alpha = 0.001, max_iter_epoch = 1000):
        self.w = w
        self.b = b
        self.alpha = alpha
        self.max_iter_epoch = max_iter_epoch
        
    def linear_model(self, X):
        """功能：實現線性模型"""
        return np.dot(X, self.w) + self.b
         
    def fit(self, X, y):
        """
        功能：擬合感知機模型
        引數 X：訓練集的輸入資料
        引數 y：訓練集的輸出資料
        """
        # 按訓練集的輸入維度初始化w
        self.w = np.zeros(X.shape[1])
        # 誤分類的樣本就為True
        state = np.sign(self.linear_model(X)) != y
        # 迭代輪數
        total_iter_epoch = 1
        
        while state.any() and (total_iter_epoch <= self.max_iter_epoch):
            # 使用誤分類點進行權重更新
            self.w += self.alpha * y[state][0] * X[state][0]
            self.b += self.alpha * y[state][0]
            
            # 狀態更新
            total_iter_epoch += 1
            state = np.sign(self.linear_model(X)) != y
            
        print(f"fit model_perceptron(alpha = {self.alpha}, max_iter_epoch = {self.max_iter_epoch}, total_iter_epoch = {min(self.max_iter_epoch, total_iter_epoch)})")
        
    def predict(self, X):
        """
        功能：模型預測
        引數 X：測試集的輸入資料
        """
        return np.sign(self.linear_model(X)) 
    
    def score(self, X, y):
        """
        功能：模型評價（準確率）
        引數 X：測試集的輸入資料
        引數 y：測試集的輸出資料
        """
        y_predict = self.predict(X)
        y_score = (y_predict == y).sum() / len(y)
        
        return y_score

# 二分類的情況（原始形式）/ 資料集的處理與劃分
X = xdata[ydata < 2]
y = ydata[ydata < 2]
y = np.where(y == 0, -1, 1)
xtrain, xtest, ytrain, ytest = train_test_split(X, y)

# 原始形式的驗證
ppn = model_perceptron()
ppn.fit(xtrain, ytrain)
ppn.predict(xtest)
ppn.score(xtest, ytest)

結果顯示（由於隨機劃分資料集，執行結果不一定和圖示相同）：
感知機的原始形式

4. 感知機的對偶形式

class perceptron_dual(object):
    """
    功能：實現感知機的對偶形式
    引數 beta：每個例項點更新的次陣列成的向量
    引數 w：權重，預設都為None
    引數 b：偏置項，預設為0
    引數 alpha：學習率，預設0.001
    引數 max_iter_epoch：最大迭代次數，預設為1000
    """
    def __init__(self, alpha = 0.001, max_iter_epoch = 1000):
        self.beta = None
        self.w = None
        self.b = 0
        self.alpha = alpha
        self.max_iter_epoch = max_iter_epoch
        
    def fit(self, X, y):
        # 例項點的數量
        xnum = X.shape[0]
        # 初始化
        self.beta = np.zeros(xnum)
        
        # gram矩陣
        gram = np.dot(X, X.T)
        
        # 迭代條件
        state = y*((self.beta * y * gram).sum(axis = 1) + self.b) <= 0
        iter_epoch = 1
        
        while state.any() and (iter_epoch <= self.max_iter_epoch):
            nx = X[state][0]
            ny = y[state][0]
            index = (X == nx).argmax()
            self.beta[index] += self.alpha
            self.b += ny
            
            # 更新條件
            iter_epoch += 1
            state = y*((self.beta * y * gram).sum(axis = 1) + self.b) <= 0
        
        # 通過beta計算出w
        self.w = ((self.beta * y).reshape(-1, 1) * X).sum(axis = 0) 
        print(f"fit perceptron_dual(alpha = {self.alpha}, total_iter_epoch = {min(self.max_iter_epoch, iter_epoch)})")
            
        
    def predict(self, X):
        """
        功能：模型預測
        引數 X：測試集的輸入資料
        """
        y_predict = np.sign(X @ self.w  + self.b)
        return y_predict
    
    def score(self, X, y):
        """
        功能：模型評價（準確率）
        引數 X：測試集的輸入資料
        引數 y：測試集的輸出資料
        """
        y_score = (self.predict(X) == y).sum() / len(y)
        
        return y_score

# 二分類的情況（對偶形式）/ 資料集的處理與劃分
X = xdata[ydata < 2]
y = ydata[ydata < 2]
y = np.where(y == 0, -1, 1)
xtrain, xtest, ytrain, ytest = train_test_split(X, y)

# 對偶形式驗證
ppn = perceptron_dual()
ppn.fit(xtrain, ytrain)
ppn.predict(xtest)
ppn.score(xtest, ytest)

結果顯示（由於隨機劃分資料集，執行結果不一定和圖示相同）：
感知機的對偶形式

5. 多分類情況—one vs. rest

假設有k個類別，ovr策略是生成k個分類器，最後選取概率最大的預測結果

class perceptron_ovr(object):
    """
    功能：實現感知機的多分類情形（採用one vs. rest策略）
    引數 w：權重，預設都為None
    引數 b：偏置項，預設為0
    引數 alpha：學習率，預設0.001
    引數 max_iter_epoch：最大迭代次數，預設為1000
    """
    def __init__(self, alpha = 0.001, max_iter_epoch = 1000):
        self.w = None
        self.b = None
        self.alpha = alpha
        self.max_iter_epoch = max_iter_epoch
        
    def linear_model(self, X):
        """功能：實現線性模型"""
        return np.dot(self.w, X.T) + self.b
        
    def fit(self, X, y):
        """
        功能：擬合感知機模型
        引數 X：訓練集的輸入資料
        引數 y：訓練集的輸出資料
        """
        # 生成各分類器對應的標記
        self.y_class = np.unique(y)
        y_ovr = np.vstack([np.where(y == i, 1, -1) for i in self.y_class])
        
        # 初始化w, b
        self.w = np.zeros([self.y_class.shape[0], X.shape[1]])
        self.b = np.zeros([self.y_class.shape[0], 1])
        
        # 擬合各分類器，並更新相應維度的w和b
        for index in range(self.y_class.shape[0]):
            ppn = model_perceptron(alpha = self.alpha, max_iter_epoch = self.max_iter_epoch)
            ppn.fit(X, y_ovr[index])
            self.w[index] = ppn.w
            self.b[index] = ppn.b
            
    def predict(self, X):
        """
        功能：模型預測
        引數 X：測試集的輸入資料
        """
        # 值越大，說明第i維的分類器將該點分得越開，即屬於該分類器的概率值越大
        y_predict = self.linear_model(X).argmax(axis = 0)
        
        # 還原原資料集的標籤
        for index in range(self.y_class.shape[0]):
            y_predict = np.where(y_predict == index, self.y_class[index], y_predict)
            
        return y_predict
    
    def score(self, X, y):
        """
        功能：模型評價（準確率）
        引數 X：測試集的輸入資料
        引數 y：測試集的輸出資料
        """
        y_score = (self.predict(X) == y).sum()/len(y)
        return y_score

# 多分類資料集處理
xtrain, xtest, ytrain, ytest = train_test_split(xdata, ydata)

# one vs. rest的驗證
ppn = perceptron_ovr()
ppn.fit(xtrain, ytrain)
ppn.predict(xtest)
ppn.score(xtest, ytest)

結果顯示（由於隨機劃分資料集，執行結果不一定和圖示相同）：
one vs. rest

6. 多分類情況—one vs. one

假設有k個類別，生成k(k-1)/2個二分類器，最後通過多數投票來選取預測結果

from itertools import combinations

class perceptron_ovo(object):
    """
    功能：實現感知機的多分類情形（採用one vs. one策略）
    引數 w：權重，預設都為None
    引數 b：偏置項，預設為0
    引數 alpha：學習率，預設0.001
    引數 max_iter_epoch：最大迭代次數，預設為1000
    """
    def __init__(self, alpha = 0.001, max_iter_epoch = 1000):
        self.w = None
        self.b = None
        self.alpha = alpha
        self.max_iter_epoch = max_iter_epoch
        
    def linear_model(self, X):
        """功能：實現線性模型"""
        return np.dot(self.w, X.T) + self.b
        
    def fit(self, X, y):
        """
        功能：擬合感知機模型
        引數 X：訓練集的輸入資料
        引數 y：訓練集的輸出資料
        """
        # 生成各分類器對應的標記（使用排列組合）
        self.y_class = np.unique(y)
        self.y_combine = [i for i in combinations(self.y_class, 2)]
        
        # 初始化w和b
        clf_num = len(self.y_combine)
        self.w = np.zeros([clf_num, X.shape[1]])
        self.b = np.zeros([clf_num, 1])
        
        for index, label in enumerate(self.y_combine):
            # 根據各分類器的標籤選取資料集
            cond = pd.Series(y).isin(pd.Series(label))
            xdata, ydata = X[cond], y[cond]
            ydata = np.where(ydata == label[0], 1, -1)
            
            # 擬合各分類器，並更新相應維度的w和b
            ppn = model_perceptron(alpha = self.alpha, max_iter_epoch = self.max_iter_epoch)
            ppn.fit(xdata, ydata)
            self.w[index] = ppn.w
            self.b[index] = ppn.b
    
    def voting(self, y):
        """
        功能：投票
        引數 y：各分類器的預測結果，接受的是元組如(1, 1, 2)
        """
        # 統計分類器預測結果的出現次數
        y_count = np.unique(np.array(y), return_counts = True)
        # 返回出現次數最大的結果位置索引
        max_index = y_count[1].argmax()
        # 返回某個例項投票後的結果
        y_predict = y_count[0][max_index]
        
        return y_predict
        
                      
    def predict(self, X):
        """
        功能：模型預測
        引數 X：測試集的輸入資料
        """
        # 預測結果
        y_predict = np.sign(self.linear_model(X))
        # 還原標籤（根據排列組合的標籤）
        for index, label in enumerate(self.y_combine):
            y_predict[index] = np.where(y_predict[index] == 1, label[0], label[1])
        
        # 列為某一個例項的預測結果，打包用於之後的投票
        predict_zip = zip(*(i.reshape(-1) for i in np.vsplit(y_predict, self.y_class.shape[0])))
        # 投票得到預測結果
        y_predict = list(map(lambda x: self.voting(x), list(predict_zip)))
        
        return np.array(y_predict)
    
    def score(self, X, y):
        """
        功能：模型評價（準確率）
        引數 X：測試集的輸入資料
        引數 y：測試集的輸出資料
        """
        y_predict = self.predict(X)
        y_score = (y_predict == y).sum() / len(y)
        
        return y_score

# 多分類資料集處理
xtrain, xtest, ytrain, ytest = train_test_split(xdata, ydata)

# one vs. one的驗證
ppn = perceptron_ovo()
ppn.fit(xtrain, ytrain)
ppn.predict(xtest)
ppn.score(xtest, ytest)

結果顯示（由於隨機劃分資料集，執行結果不一定和圖示相同）：
one vs. one
準確率一般比one vs. rest要高，但是生成的分類器多

7. sklearn實現

主要使用sklearn中的Perceptron模組，其中可以實現多分類的情況（預設採用one vs. rest）

from sklearn.linear_model import Perceptron

xtrain, xtest, ytrain, ytest = train_test_split(xdata, ydata)
ppn = Perceptron(max_iter = 1000)
ppn.fit(xtrain, ytrain)
ppn.predict(xtest)
ppn.score(xtest, ytest)

結果顯示：
sklearn實現

8. 感知機演算法的作圖

from matplotlib.colors import ListedColormap

def decision_plot(X, Y, clf, test_idx = None, resolution = 0.02):
    """
    功能：畫分類器的決策圖
    引數 X：輸入例項
    引數 Y：例項標記
    引數 clf：分類器
    引數 test_idx：測試集的index
    引數 resolution：np.arange的間隔大小
    """
    # 標記和顏色設定
    markers = ['o', 's', 'x', '^', '>']
    colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan')
    cmap = ListedColormap(colors[:len(np.unique(Y))])
    
    # 圖形範圍
    xmin, xmax = X[:, 0].min() - 1, X[:, 0].max() + 1
    ymin, ymax = X[:, 1].min() - 1, X[:, 1].max() + 1
    x = np.arange(xmin, xmax, resolution)
    y = np.arange(ymin, ymax, resolution)
    
    # 網格
    nx, ny = np.meshgrid(x, y)
    
    # 資料合併
    xdata = np.c_[nx.reshape(-1), ny.reshape(-1)]
    
    # 分類器預測
    z = clf.predict(xdata)
    z = z.reshape(nx.shape)
    
    # 作區域圖
    plt.contourf(nx, ny, z, alpha = 0.4, cmap = cmap)
    plt.xlim(nx.min(), nx.max())
    plt.ylim(ny.min(), ny.max())
    
    # 畫點
    for index, cl in enumerate(np.unique(Y)):
        plt.scatter(x=X[Y == cl, 0], y=X[Y == cl, 1],
                    alpha=0.8, c = cmap(index), 
                    marker=markers[index], label=cl)
    
    # 突出測試集的點
    if test_idx:
        X_test, y_test = X[test_idx, :], y[test_idx]

        plt.scatter(X_test[:, 0],
                    X_test[:, 1],
                    alpha=0.15,
                    linewidths=2,
                    marker='^',
                    edgecolors='black',
                    facecolors='none',
                    s=55, label='test set')

# 作圖時的資料處理
X = xdata[ydata < 2, :2]
y = ydata[ydata < 2]
y = np.where(y == 0, -1, 1)

xtrain, xtest, ytrain, ytest = train_test_split(X, y)
ppn = model_perceptron()
ppn.fit(xtrain, ytrain)
decision_plot(X, y, ppn)
plt.legend()

結果顯示：
感知機作圖

感知機程式碼
2024-08-07
感知機簡單實現
2019-10-12
利用orm 在業務程式碼無感知下，實現實現分庫分表
2021-06-09
ORM
感知器演算法及其python 實現 V2.0
2021-11-18
演算法Python
圖解Dijkstra演算法+程式碼實現
2022-05-20
圖解演算法
torch--多層感知機實現影像分類
2024-11-04
手擼機器學習演算法 - 感知機
2021-06-11
機器學習演算法
手寫演算法-python程式碼實現Kmeans
2020-12-17
演算法Python
隨機快速排序Java程式碼實現
2020-11-09
隨機排序Java
統計學習方法ｃ++實現之一　感知機
2018-12-14
動手實現程式碼虛擬機器
2020-08-19
虛擬機
常見排序演算法原理及JS程式碼實現
2020-08-07
排序演算法JS
量子圖形加密演算法的MATLAB程式碼實現
2023-03-11
加密演算法Matlab
Python-遺傳演算法君主交叉程式碼實現
2021-08-12
Python演算法
圖解KMP字串匹配演算法+程式碼實現
2022-05-10
圖解KMP字串匹配演算法
40行程式碼實現React核心Diff演算法
2022-04-15
行程React演算法
180行JavaScript程式碼實現的小球隨機移動程式碼
2020-03-18
JavaScript隨機
java實現人機猜拳遊戲的程式碼
2021-11-26
Java遊戲
幾行程式碼實現負載均衡輪詢演算法
2019-04-03
行程負載演算法
負載均衡的幾種演算法Java實現程式碼
2020-04-05
負載演算法Java
K-近鄰演算法介紹與程式碼實現
2019-07-05
演算法
全面瞭解歸併排序演算法及程式碼實現
2021-12-09
排序演算法
畫直線的演算法之DDA演算法+程式碼實現（法一）
2019-03-31
演算法
Tomcat程式碼實現
2018-11-08
Tomcat
Promise 程式碼實現
2019-01-01
Promise
基於結構化平均感知機的分詞器Java實現
2019-01-14
分詞Java
深度學習：多層感知機和異或問題(Pytorch實現)
2022-02-15
深度學習PyTorch
基於感知機的人名-性別預測系統 —— Python實現
2020-12-30
Python
感知機模型
2024-09-06
模型
OutputStreamWriter介紹&程式碼實現和InputStreamReader介紹&程式碼實現
2022-07-09
Locust 程式碼指令碼實現
2024-03-16
指令碼
【Python機器學習實戰】感知機和支援向量機學習筆記（三）之SVM的實現
2021-08-11
Python機器學習筆記
支援向量機（SVM）從原理到python程式碼實現
2020-12-10
Python
虛擬主機php程式碼實現強制https
2021-01-31
PHPHTTP
用6行Python程式碼實現選擇性排序演算法
2020-03-12
Python排序演算法
verilog的RR輪詢排程演算法的程式碼實現
2020-07-21
演算法
演算法案例2-求冰雹數 java程式碼實現
2020-11-24
演算法Java
分類演算法-多層感知機 Multi-layer Perceptron
2020-01-19
演算法