感知機模型

归去_来兮發表於2024-09-06

原文網址 : https://www.cnblogs.com/hywang1211/p/18061912

一、概述

感知機模型(Perceptron Model)也叫做神經元模型，設計靈感即來自於生物神經元的執行機制，依次完成資訊接收、處理、輸出的過程。當前大放異彩的各種人工神經網路模型即由一個個人工神經元構成，因此，本文介紹的感知機模型（神經元模型）就是各種神經網路模型的基本單元。

二、模型原理

模型原理

模型的核心概況起來即是線性迴歸+符號函式對映。對未知資料，先做線性擬合，輸出值再經符號函式對映，完成類別判定。因此，感知機模型也是直接用於二分類任務的模型。模型示意圖可表示為

模型原理直接地表示也就是

\[y=\left\{ \begin{aligned} &-1, \ w\cdot x+b<0\\ &1, \ w\cdot x+b\geq 0 \end{aligned} \right. \]

對任意待測樣本，將其特徵向量直接代入計算即可。

模型的訓練

模型的引數就是指線性迴歸中的權重和偏置，確定了它們也就確定了整個模型。對引數的確定往往透過訓練資料集實施，也就是由訓練集和標籤之間的對應構造一個關於待求引數的損失函式，透過不斷迭代最佳化，在過程中確定出最佳的引數值。損失函式的構造通常採用這樣一種方式，就是計算所有誤分類樣本到決策函式的距離和。表示式為

\[d=\frac{1}{\left| \left| w \right| \right|}\sum_{x_i\in M}{\left| w\cdot x_i+b \right|} \]

其中，\(\left| \left| w \right| \right|=\sqrt{w_{1}^{2}+w_{2}^{2}+...+w_{n}^{2}}\)，M為誤分類樣本集。
為進一步簡化，可以將絕對值計算以‘-y’等價替換。y是樣本的標籤，取值要麼為1，要麼為-1，若y為1，表明樣本為正，錯誤判定時計算得到的迴歸值為負，此時‘-y負值’為正；若y為-1，表明樣本為負，錯誤判定時計算得到的迴歸值為正，此時‘-y正值’仍為正，與絕對值運算等價，此時損失函式表示式為

\[d=-\frac{1}{\left| \left| w \right| \right|}\sum_{x_i\in M}{y_i(w\cdot x_i+b)} \]

式中的\(\frac{1}{\left| \left| w \right| \right|}\)實質地表徵了決策函式的方向性，而模型關注的是對兩類樣本的類別結果判定，並不實際關注決策函式的具體方向以及樣本到函式距離的具體差異，因而該部分可以省去，損失函式也就簡化為

\[d=-\sum_{x_i\in M}{y_i(w\cdot x_i+b)} \]

三、Python實現

手工實現：

import numpy as np
from sklearn import datasets

def model(X, theta):
    return X @ theta

def predict(x, theta):
    flags = model(x, theta)
    y = np.ones_like(flags)
    y[np.where(flags < 0)[0]] = -1
    return y

def computerCost(X, y, theta):
    y_pred = predict(X, theta)
    error_index = np.where(y_pred != y)[0]
    return np.squeeze(-y_pred[error_index].T @ y[error_index])

def gradientDescent(X, y, alpha, num_iters=1000):
    n = X.shape[1]
    theta = np.zeros((n, 1))
    J_history = []
    for i in range(num_iters):
        y_pred = predict(X, theta)
        error_index = np.where(y_pred != y)[0]
        theta = theta + alpha * X[error_index, :].T @ y[error_index]
        cur_cost = computerCost(X, y, theta)
        J_history.append(cur_cost)
        print('.', end='')
        if cur_cost == 0:
            print(f'Finished in advance in iteration {i + 1}!')
            break

    return theta, J_history

iris = datasets.load_iris()
X = iris.data
m = X.shape[0]
X = np.hstack((np.ones((m, 1)), X))
y = iris.target
y[np.where(y != 0)[0]] = -1
y[np.where(y == 0)[0]] = 1
y = y.reshape((len(y), 1))
theta, J_history = gradientDescent(X, y, 0.01, 1000)
y_pred = predict(X, theta)
acc = np.sum(y_pred == y) / len(y)

print('acc:\n', acc)

基於PyTorch實現：

import torch
import torch.nn as nn
import torch.optim as optim
import matplotlib
matplotlib.use('TkAgg')
import matplotlib.pyplot as plt
import numpy as np

# 生成一些隨機的線性可分資料
np.random.seed(42)
num_samples = 100
features = 2
x = 10 * np.random.rand(num_samples, features)  # 生成隨機輸入特徵
w_true = np.array([2, -3.4])  # 真實的權重
b_true = 4.2  # 真實的偏置
y_true = np.dot(x, w_true) + b_true + 0.1 * np.random.randn(num_samples)  # 新增噪聲
y_true = np.where(y_true > 0, 1, -1)  # 將輸出標籤轉換為二分類問題

# 將資料轉換為 PyTorch 的 Tensor
x = torch.tensor(x, dtype=torch.float32)
y_true = torch.tensor(y_true, dtype=torch.float32)

# 定義感知機模型
class Perceptron(nn.Module):
    def __init__(self, input_size):
        super(Perceptron, self).__init__()
        self.linear = nn.Linear(input_size, 1)

    def forward(self, x):
        return torch.sign(self.linear(x))

# 初始化感知機模型
perceptron = Perceptron(input_size=features)

# 定義損失函式和最佳化器
criterion = nn.MSELoss()
optimizer = optim.SGD(perceptron.parameters(), lr=0.01)

# 訓練感知機模型
num_epochs = 100
for epoch in range(num_epochs):
    # 前向傳播
    y_pred = perceptron(x)

    # 計算損失
    loss = criterion(y_pred.view(-1), y_true)

    # 反向傳播和最佳化
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    # 列印損失
    if (epoch + 1) % 10 == 0:
        print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')

# 在訓練資料上進行預測
with torch.no_grad():
    predictions = perceptron(x).numpy()

# 視覺化結果
plt.scatter(x[:, 0], x[:, 1], c=predictions.flatten(), cmap='coolwarm', marker='o')
plt.title('Perceptron Model')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()

End.

pdf下載

感知機介紹
2020-10-26
感知機程式碼
2024-08-07
感知機與支援向量機 (SVM)
2021-06-24
感知機簡單實現
2019-10-12
HDFS的機架感知策略
2020-06-15
感知機（perceptron）原理總結
2020-07-21
[python學習]機器學習 -- 感知機
2020-10-19
Python機器學習
Hadoop安全模式和機架感知
2023-03-07
Hadoop模式
[深度學習]多層感知機（MLP）
2024-04-13
深度學習
手擼機器學習演算法 - 感知機
2021-06-11
機器學習演算法
CVPR 2024 | 一統所有目標感知任務，華科&位元組提出目標感知基礎模型GLEE
2024-03-21
模型
上下文感知與態勢感知或情境感知區別
2021-06-27
感知機演算法（PLA）程式碼實現
2020-07-22
演算法
視覺感知未來，高德資料採集模型部署實踐！
2021-06-04
視覺模型
機器視覺之外，機器人的感知補全計劃
2020-09-02
視覺機器人
HDFS 02 - HDFS 的機制：副本機制、機架感知機制、負載均衡機制
2021-02-20
負載
ML.NET 示例：推薦之場感知分解機
2018-12-13
SLAM +機器學習迎來了“感知時代”
2020-07-30
SLAM機器學習
torch--多層感知機實現影像分類
2024-11-04
《深度學習入門》第 2 章感知機筆記
2018-11-30
深度學習筆記
統計學習方法筆記-感知機學習方法
2023-05-16
筆記
Alink漫談(十五) ：多層感知機之迭代優化
2020-07-29
優化
模型壓縮：識別感知的深度神經網路通道裁剪 | 論文分享
2019-01-10
模型神經網路
分詞工具Hanlp基於感知機的中文分詞框架
2019-04-03
HanLP中文分詞框架
統計學習方法ｃ++實現之一　感知機
2018-12-14
分類演算法-多層感知機 Multi-layer Perceptron
2020-01-19
演算法
Alink漫談(十四) ：多層感知機之總體架構
2020-07-26
架構
計算機如何感知大資料——聚類演算法
2018-04-04
計算機大資料聚類演算法
TensorFlow2程式設計練習——多層感知機MLP
2021-08-09
程式設計
puppet單機模型
2018-09-10
模型
使用Minifly打造基於視覺感知的跟蹤無人機
2019-08-07
視覺無人機
1. 從多層感知機到卷積神經網路
2019-02-13
卷積神經網路
從感知機到Transformer，一文概述深度學習簡史
2022-05-24
ORM深度學習
jQuery感知滑鼠滑入方向
2018-06-02
jQuery
機器學習模型
2024-03-30
機器學習模型
計算機潛意識- 單層神經網路（感知器）
2019-01-12
計算機神經網路
基於結構化平均感知機的分詞器Java實現
2019-01-14
分詞Java
深度學習：多層感知機和異或問題(Pytorch實現)
2022-02-15
深度學習PyTorch