TensorFlow系列專題（五）：BP演算法原理

磐創AI發表於2018-11-20

TensorFlow系列專題（五）：BP演算法原理

目錄：

反向傳播演算法簡介
前饋計算的過程

第一層隱藏層的計算
第二層隱藏層的計算
輸出層的計算

反向傳播的計算

計算偏導數

參考文獻

一．反向傳播演算法

反向傳播演算法[1]（Backpropagation Algorithm，簡稱BP演算法）是深度學習的重要思想基礎，對於初學者來說也是必須要掌握的基礎知識，在這一小節裡，我們會較為詳細的介紹這一重點知識。

我們使用一個如圖1所示的神經網路，該圖所示是一個三層神經網路，兩層隱藏層和一層輸出層，輸入層有兩個神經元，接收輸入樣本(x1,x2)， TensorFlow系列專題（五）：BP演算法原理為網路的輸出。

TensorFlow系列專題（五）：BP演算法原理

圖1 一個三層神經網路

二．前饋計算的過程

為了理解神經網路的運算過程，我們需要先搞清楚前饋計算，即資料沿著神經網路前向傳播的計算過程，以圖1所示的網路為例：

輸入的樣本為：

TensorFlow系列專題（五）：BP演算法原理

公式1

第一層網路的引數為：

TensorFlow系列專題（五）：BP演算法原理

公式2

第二層網路的引數為：

TensorFlow系列專題（五）：BP演算法原理

公式3

第三層網路的引數為：

TensorFlow系列專題（五）：BP演算法原理

公式4

·第一層隱藏層的計算

TensorFlow系列專題（五）：BP演算法原理

圖2 計算第一層隱藏層

第一層隱藏層有三個神經元：neu1、neu2和neu3。該層的輸入為：

TensorFlow系列專題（五）：BP演算法原理

公式5

以neu1神經元為例，則其輸入為：

TensorFlow系列專題（五）：BP演算法原理

公式6

同理有：

TensorFlow系列專題（五）：BP演算法原理

公式7

TensorFlow系列專題（五）：BP演算法原理

公式8

假設我們選擇函式f(x)作為該層的啟用函式（圖1中的啟用函式都標了一個下標，一般情況下，同一層的啟用函式都是一樣的，不同層可以選擇不同的啟用函式），那麼該層的輸出為： TensorFlow系列專題（五）：BP演算法原理

·第二層隱藏層的計算

TensorFlow系列專題（五）：BP演算法原理

圖3 計算第二層隱藏層

第二層隱藏層有兩個神經元：neu4和neu5。該層的輸入為：

TensorFlow系列專題（五）：BP演算法原理

公式9

即第二層的輸入是第一層的輸出乘以第二層的權重，再加上第二層的偏置。因此得到neu4和neu5的輸入分別為：

TensorFlow系列專題（五）：BP演算法原理

公式10

TensorFlow系列專題（五）：BP演算法原理

公式11

該層的輸出分別為： TensorFlow系列專題（五）：BP演算法原理

·輸出層的計算

TensorFlow系列專題（五）：BP演算法原理

圖4 計算輸出層

輸出層只有一個神經元：neu6。該層的輸入為：

TensorFlow系列專題（五）：BP演算法原理

公式12

即：

TensorFlow系列專題（五）：BP演算法原理

公式13

因為該網路要解決的是一個二分類問題，所以輸出層的啟用函式也可以使用一個Sigmoid型函式，神經網路最後的輸出為： TensorFlow系列專題（五）：BP演算法原理

三．反向傳播的計算

上一小節裡我們已經瞭解了資料沿著神經網路前向傳播的過程，這一節我們來介紹更重要的反向傳播的計算過程。假設我們使用隨機梯度下降的方式來學習神經網路的引數，損失函式定義為 TensorFlow系列專題（五）：BP演算法原理

其中y是該樣本的真實類標。使用梯度下降進行引數的學習，我們必須計算出損失函式關於神經網路中各層引數（權重w和偏置b）的偏導數。

假設我們要對第k層隱藏層的 TensorFlow系列專題（五）：BP演算法原理

假設 TensorFlow系列專題（五）：BP演算法原理代表第k層神經元的輸入，即

其中n^(k-1)為前一層神經元的輸出，則根據鏈式法則有：

TensorFlow系列專題（五）：BP演算法原理

公式14

TensorFlow系列專題（五）：BP演算法原理

公式15

因此，我們只需要計算偏導數 TensorFlow系列專題（五）：BP演算法原理

·計算偏導數 TensorFlow系列專題（五）：BP演算法原理

前面說過，第k層神經元的輸入為：，因此可以得到：

TensorFlow系列專題（五）：BP演算法原理

公式16

TensorFlow系列專題（五）：BP演算法原理

我們以1.1節中的簡單神經網路為例，假設我們要計算第一層隱藏層的神經元關於權重矩陣的導數，則有：

TensorFlow系列專題（五）：BP演算法原理

公式17

·計算偏導數 TensorFlow系列專題（五）：BP演算法原理

因為偏置b是一個常數項，因此偏導數的計算也很簡單：

TensorFlow系列專題（五）：BP演算法原理

公式18

依然以第一層隱藏層的神經元為例，則有：

TensorFlow系列專題（五）：BP演算法原理

公式19

·計算偏導數 TensorFlow系列專題（五）：BP演算法原理

TensorFlow系列專題（五）：BP演算法原理

根據第一節的前向計算，我們知道第k+1層的輸入與第k層的輸出之間的關係為：

TensorFlow系列專題（五）：BP演算法原理

公式20

TensorFlow系列專題（五）：BP演算法原理

TensorFlow系列專題（五）：BP演算法原理

公式21

TensorFlow系列專題（五）：BP演算法原理

TensorFlow系列專題（五）：BP演算法原理

公式22

TensorFlow系列專題（五）：BP演算法原理

公式23

下面是基於隨機梯度下降更新引數的反向傳播演算法：

輸入：

TensorFlow系列專題（五）：BP演算法原理

TensorFlow系列專題（五）：BP演算法原理

以上是BP演算法的介紹，下次文章中有一個BP演算法計算的完整示例，希望加深理解的讀者可以跟著示例計算一遍。

四．參考文獻

[1]. Learing representations by back-propagatingerros.David E.Rumelhart,Geoffrey E.Hinton,Ronald J.Williams

原文連結：https://mp.weixin.qq.com/s/fbEM1sk6hTWeGkHI-DNJdg

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31555081/viewspace-2220802/，如需轉載，請註明出處，否則將追究法律責任。

相關文章

TensorFlow系列專題（三）：深度學習簡介
2018-11-20
深度學習
《TensorFlow2.0》前饋神經網路和 BP 演算法
2020-12-08
神經網路演算法
TensorFlow系列專題（二）：機器學習基礎
2018-11-05
機器學習
TensorFlow系列專題（一）：機器學習基礎
2018-11-05
機器學習
『TensorFlow』專題彙總
2018-03-14
一文徹底搞懂BP演算法：原理推導+資料演示+專案實戰（上篇）
2018-10-24
演算法
TensorFlow系列專題（六）：實戰專案Mnist手寫資料集識別
2018-11-22
Dive into TensorFlow系列（1）-靜態圖執行原理
2022-11-11
BP演算法和LMBP演算法
2021-01-03
演算法
TensorFlow系列專題（九）：常用RNN網路結構及依賴優化問題
2018-11-23
RNN優化
?【Spring專題】「原理系列」SpringMVC的執行工作原理（補充修訂）
2021-12-25
SpringMVC
TensorFlow損失函式專題
2020-04-06
函式
TensorFlow系列專題（七）：一文綜述RNN迴圈神經網路
2018-11-22
RNN神經網路
第五章字串專題 ---------------- 字串匹配(二)----KMP演算法
2019-03-19
字串匹配KMP演算法
JVM系列(五) - JVM垃圾回收演算法
2018-07-17
JVM演算法
Tensorflow系列專題（四）：神經網路篇之前饋神經網路綜述
2018-11-20
神經網路
演算法題系列3
2024-08-10
演算法
演算法題系列4
2024-08-11
演算法
關於BP演算法的一點理解
2018-04-09
演算法
微核心專題系列
2018-10-27
【Netty技術專題】「原理分析系列」Netty強大特性之ByteBuf零拷貝技術原理分析
2021-12-29
Netty
第五章字串專題 ---------------- 字串匹配(三)----字尾陣列演算法
2019-03-19
字串匹配陣列演算法
TensorFlow系列專題（八）：七步帶你實現RNN迴圈神經網路小示例
2018-11-22
RNN神經網路
專題五並查集【Kuangbin】
2019-02-14
並查集
Spring Cloud專題之五：config
2021-08-01
SpringCloud
JS 專題系列-前端路由
2019-01-29
JS前端路由
機器學習Sklearn系列：（五）聚類演算法
2021-07-22
機器學習聚類演算法
BP演算法是從天上掉下來的嗎？
2018-07-13
演算法
leetcode排序專題演算法刷題
2024-10-10
LeetCode排序演算法
Leetcode 演算法題解系列 - 最小棧
2022-01-22
LeetCode演算法
【隱私計算筆談】MPC系列專題（十九）：三方複製秘密共享（五）
2023-05-17
Android元件化專題 - 路由框架原理
2018-12-20
Android元件化路由框架
資訊系統專案管理系列之五：專案整體管理
2020-04-04
專案管理
「前端面試題系列4」this的原理以及用法
2019-01-20
前端面試題
【Java技術專題】「原理專題」深入分析Java中finalize方法的作用和底層原理
2022-12-29
Java
ACM演算法——數學專題
2024-08-19
ACM演算法
?【Alibaba中介軟體技術系列】「Nacos技術專題」配置中心載入原理和配置實時更新原理分析（上）
2022-01-20
?【Alibaba中介軟體技術系列】「Nacos技術專題」配置中心載入原理和配置實時更新原理分析（中）
2022-01-21