神經網路基礎 - Python程式設計實現標準BP演算法

Snoopy_Yuan發表於2017-04-25

神經網路Python程式設計演算法

程式設計基於python，完整程式碼託管在我的Github PY131/Practice-of-Machine-Learning，歡迎訪問。

基礎知識參考“周志華《機器學習》第五章-神經網路”

1. BP演算法分析

如下圖所示BP網路：

這裡寫圖片描述

對樣本 a = (x_k,y_k)，其輸出為 ^y_k，即是：

這裡寫圖片描述

由此得出在樣本 a 上的均方誤差：

這裡寫圖片描述

我們的目標是是所有樣本得出的均方誤差最小化，為此我們要找到最優的引數（即上圖中的連線權(w, v)及對應閾值(θ, γ)）。考慮梯度下降法。比如對於 w = w+Δw，梯度下降法調整式為：

這裡寫圖片描述

式中，η 是學習率，他控制著演算法迭代步長，直接關係著演算法的收斂速度甚至收斂性。

對於圖示BP網路，梯度項有：

這裡寫圖片描述

其中：

這裡寫圖片描述

當採用Sigmoid函式作為每個神經元的啟用函式是，可以根據其導數性質：

這裡寫圖片描述

來得出最終的梯度項 g_j*b_h，其中：

這裡寫圖片描述

於是得出BP演算法關於引數 w 的更新公式：

這裡寫圖片描述

同樣的方式可以推匯出其他引數的更新公式，綜上，可以得出BP演算法中引數的更新公式如下：

這裡寫圖片描述

其中：

這裡寫圖片描述

經過上面的推導，給出標準BP演算法如下圖所示：

Algorithm 1. 標準BP演算法
----
    輸入： 訓練集 D，學習率 η.
    過程： 
        1. 隨即初始化連線權與閾值 (ω，θ).
        2. Repeat：
        3.   for x_k，y_k in D:
        4.     根據當前引數計算出樣本誤差 E_k.
        5.     根據公式計算出隨機梯度項 g_k.
        6.     根據公式更新 (ω，θ).
        7.   end for
        8. until 達到停止條件
    輸出：(ω，θ) - 即相應的多層前饋神經網路.
----

2. BP演算法程式設計實現

採用python程式設計實現上面的演算法，首先明確一些需求：

程式應保留神經網路結構調整的靈活性，主要面向隱層節點數的變動；
程式應保留啟用函式過載功能，此處先採用Sigmoid啟用函式；
程式應保留學習率設定功能，此處先採用固定學習率實現；
程式應具有快速高效，如考慮python-numpy進行高效的矩陣運算；
…

下面是簡單的標準BP演算法程式示例：

def BackPropagate(self, x, y, lr):
    '''
    the implementation of BP algorithms on one slide of sample

    @param x, y: array, input and output of the data sample
    @param lr: float, the learning rate of gradient decent iteration
    '''

    # dependent packages
    import numpy as np 

    # get current network output
    self.Pred(x)

    # calculate the gradient based on output
    o_grid = np.zeros(self.o_n) 
    for j in range(self.o_n):
        o_grid[j] = (y[j] - self.o_v[j]) * self.afd(self.o_v[j])

    h_grid = np.zeros(self.h_n)
    for h in range(self.h_n):
        for j in range(self.o_n):
            h_grid[h] += self.ho_w[h][j] * o_grid[j]
        h_grid[h] = h_grid[h] * self.afd(self.h_v[h])   

    # updating the parameter
    for h in range(self.h_n):  
        for j in range(self.o_n): 
            self.ho_w[h][j] += lr * o_grid[j] * self.h_v[h]

    for i in range(self.i_n):  
        for h in range(self.h_n): 
            self.ih_w[i][h] += lr * h_grid[h] * self.i_v[i]     

    for j in range(self.o_n):
        self.o_t[j] -= lr * o_grid[j]    

    for h in range(self.h_n):
        self.h_t[h] -= lr * h_grid[h]

完整的程式實現點選檢視

3. 分類實驗

完整實驗程式

這裡我們採用sklearn自帶的資料集生成器Samples generator中的make_circles和make_moons()函式來生成兩個二分類的非線性可分資料集：

資料集生成程式示例（生成circles資料）：

# 生成circle資料集，並新增一定的噪聲  
from sklearn.datasets import make_circles 
X, y = make_circles(100, noise=0.10)  # 2 input 1 output

資料點如下圖所示：

這裡寫圖片描述

從圖中可以看出，資料是二分類非線性可分的。採用神經網路對其分類模式進行學習是個不錯的選擇。

生成BP網路並初始化，這裡通過程式設計實現的一個BP網路類，各種操作及相關變數在類中定義。

下面是搭建網路並訓練的示例程式：

nn = BP_network()  # build a BP network class
nn.CreateNN(2, 6, 1, 'Sigmoid')  # build the network # 隱層節點數為6

for i in range(500): # 迭代500次
    err, err_k = nn.TrainStandard(X, y.reshape(len(y),1), lr=0.5)

經過大量的迭代訓練，可以觀察出神經網路在訓練樣本上的誤差收斂情況，如下圖示（由於circles的分類較困難一些，故而其上的迭代進行的次數多一些）：

這裡寫圖片描述

最總得出的分類決策區域繪製如下圖：

這裡寫圖片描述

可以看出，神經網路的分類決策區域還是比較精確的，進一步，為考慮所訓練的模型的泛化效能，可將資料集拆分為訓練集與測試集進行重新訓練與測試，並可以採用交叉驗證法等方法。

4. 小結

這裡基於python程式設計實現了標準BP演算法，並採用兩種有趣的資料集來進行的實驗。這裡給出實驗中的一些總結：

BP神經網路訓練往往需要大量的計算（體現在迭代次數多，矩陣運算規模大等）；
標準BP演算法對引數較為敏感，如學習率，迭代次數，隱層節點數等都需要注意；
一般來說，足夠多隱層節點的BP網路能夠逼近任意目標函式，但訓練資料集的不充分性始終存在，要特別注意過擬合問題。

python對BP神經網路實現
2021-04-24
Python神經網路
【深度學習基礎-07】神經網路演算法（Neural Network）上--BP神經網路基礎理論
2019-01-10
深度學習神經網路演算法
神經網路基礎篇
2021-08-30
神經網路
神經網路基礎知識
2024-11-08
神經網路
機器學習——BP神經網路演算法
2017-09-12
機器學習神經網路演算法
深度學習之Pytorch（一）神經網路基礎及程式碼實現
2020-10-08
深度學習PyTorch神經網路
[Deep Learning] 神經網路基礎
2016-06-19
神經網路
7、卷積神經網路基礎
2024-10-02
卷積神經網路
BP神經網路
2016-12-09
神經網路
深度學習教程 | 神經網路基礎
2022-04-15
深度學習神經網路
神經網路基礎及Keras入門
2018-11-21
神經網路Keras
神經網路基礎部件-BN層詳解
2023-02-10
神經網路
【深度學習基礎-08】神經網路演算法（Neural Network）上--BP神經網路例子計算說明
2019-01-10
深度學習神經網路演算法
【原創】python實現BP神經網路識別Mnist資料集
2020-11-11
Python神經網路
神經網路篇——從程式碼出發理解BP神經網路
2021-01-01
神經網路
構建兩層以上BP神經網路（python程式碼）
2020-11-26
神經網路Python
資料探勘（9）：BP神經網路演算法與實踐
2015-08-30
神經網路演算法
【人工神經網路基礎】為什麼神經網路選擇了“深度”？
2018-09-05
神經網路
BP神經網路流程圖
2018-11-01
神經網路流程圖
bp神經網路學習
2017-04-11
神經網路
粒子群優化演算法對BP神經網路優化 Matlab實現
2020-05-27
優化演算法神經網路Matlab
神經網路基礎部件-卷積層詳解
2023-02-16
神經網路卷積
神經網路基礎 - PyBrain機器學習包的使用
2017-04-14
神經網路AI機器學習
Python神經網路程式設計(TR) (2)
2020-10-29
Python神經網路程式設計
深度神經網路（DNN）反向傳播演算法(BP)
2017-02-21
神經網路DNN反向傳播演算法
資料探勘---BP神經網路
2021-01-04
神經網路
神經網路理論基礎及 Python 實現
2018-01-04
神經網路Python
神經網路基礎部件-損失函式詳解
2023-01-13
神經網路函式
圖神經網路基礎：傅立葉級數與傅立葉變換
2022-01-15
神經網路
Ng深度學習筆記——卷積神經網路基礎
2020-11-08
深度學習筆記卷積神經網路
吳恩達《卷積神經網路》課程筆記（1）– 卷積神經網路基礎
2018-08-02
吳恩達卷積神經網路筆記
《TensorFlow2.0》前饋神經網路和 BP 演算法
2020-12-08
神經網路演算法
吳恩達《神經網路與深度學習》課程筆記（3）– 神經網路基礎之Python與向量化
2018-07-29
吳恩達神經網路深度學習筆記Python
計算機網路基礎知識（面試準備）
2021-08-01
計算機網路面試
Andrew BP 神經網路詳細推導
2021-03-12
神經網路
為什麼說BP神經網路就是人工神經網路的一種？
2017-08-30
神經網路
神經網路：numpy實現神經網路框架
2021-08-19
神經網路框架
BP神經網路之MATLAB@GUI篇
2016-12-10
神經網路MatlabGUI

神經網路基礎 - Python程式設計實現標準BP演算法

1. BP演算法分析

2. BP演算法程式設計實現

3. 分類實驗

4. 小結

相關文章