詳細展示RNN的網路結構

hearthougan發表於2018-09-17

原文網址 : https://blog.csdn.net/hearthougan/article/details/82715839

下面簡單介紹一下RNN的結構，如果簡略地去看，RNN結構很簡單，根本沒有CNN那麼複雜，但是要具體實現，還是需要仔細思考一下，希望本篇部落格能把RNN結構說的明白。

迴圈神經網路（Recurrent Neural Network，RNN）DNN以及CNN在對樣本提取特徵的時候，樣本與樣本之間是獨立的，而有些情況是無法把每個輸入的樣本都看作是獨立的，比如NLP中的此行標註問題，ASR中每個音素都和前一個音素是相關的，這類問題可以看做一種帶有時序序列的問題，無法將樣本看做是相互獨立的，因此單純的DNN和CNN解決這類問題就比較棘手。此時RNN就是一種解決這類問題很好的模型。

由上圖可以看出，RNN的結構是一個重複的過程，且權重 W,U,V 是共享的，這也是借鑑了CNN的思想，可以減少引數量，從而減少計算的複雜度。第時刻隱藏層的輸出需要時刻的隱藏層的輸出，RNN以此來實現資訊的傳遞。如果上圖計算不清晰，就請看下面的兩幅圖片。

看到這兩幅圖已經很清晰地展示了RNN的整體結構，但是在具體實現的時候，或者你需要了解每一個細節，我們知道在影象處理的時候，我們的每一個影象被拉成一個向量，每一個畫素其實就是輸入層的一個神經元。並且對於隱藏層每個神經元同樣相當於一個特徵圖所構成向量的一個畫素值。所以，上述的隱藏層並不是一個單一的神經元，它是一個包含多個神經元的隱藏層，如下圖所示。這才是RNN的真正的結構。

好了，上面只是RNN的圖形描述，現在用公式的形式來對RNN的前向傳播進行描述，以下圖的符號進行描述，很容易就可以寫出前向傳播的公式。

公式符號表
符號	含義
	輸入向量的大小（one-hot長度，也是詞典大小）
	輸入的每一個序列的長度
	隱藏層神經元的個數
$X=\left \{ x_{1},x_{2},x_{3}....,x_{T} \right \}$	樣本集合
$x_{t}\epsilon \mathbb{R}^{K\times 1}$	第時刻的輸入
$y_{t}\epsilon \mathbb{R}^{K\times 1}$	第時刻經過Softmax層的輸出。
$\hat{y}_{t}\epsilon \mathbb{R}^{K\times 1}$	第時刻輸入樣本的真實標籤
$L_{t}$	第時刻的損失函式，使用交叉熵函式， $L_t=-\hat{y}_t^Tlog(y_t)$
	序列對應的損失函式: $L=\sum\limits_t^T L_t$ RNN的反向傳播是每處理完一個樣本就需要對引數進行更新，因此當執行完一個序列之後，總的損失函式就是各個時刻所得的損失之和。
$s_{t}\epsilon \mathbb{R}^{H\times 1}$	第個時刻RNN隱藏層的輸入。
$h_{t}\epsilon \mathbb{R}^{H\times 1}$	第t個時刻RNN隱藏層的輸出。
$z_{t}\epsilon \mathbb{R}^{H\times 1}$	輸出層的輸入，即Softmax函式的輸入
$W\epsilon \mathbb{R}^{H\times K}$	輸入層與隱藏層之間的權重。
$U\epsilon \mathbb{R}^{H\times H}$	上一個時刻的隱藏層與當前時刻隱藏層之間的權值。
$V\epsilon \mathbb{R}^{K\times H}$	隱藏層與輸出層之間的權重。

RNN的前向傳播過程：

$\begin{matrix} \: \: \: \: \: \: \: \: \; \; \; \; \; \; \; \; \; \; \; \; \; s_t=Uh_{t-1}+Wx_t+b\\ \\ h_t=\sigma(s_t)\\ \\ \; \; \; \; z_t=Vh_t+c\\ \\ \; \; \; \; \; \; \; \; \; \; y_t=\mathrm{softmax}(z_t) \end{matrix}$

但是RNN，與CNN或者DNN相比，其引數更新是如何實現的呢？這是訓練RNN的一個核心問題。請看下篇BPTT。

參考：

李宏毅老師課件

RNN 結構詳解
2018-12-14
RNN
CNN、RNN、DNN的內部網路結構有什麼區別？
2019-06-09
CNNRNNDNN
LetNet5網路結構詳解
2020-10-07
OSI七層網路結構詳解
2020-11-23
Swin-Transformer網路結構詳解
2022-03-07
ORM
從網路架構方面簡析迴圈神經網路RNN
2019-05-17
架構神經網路RNN
【神經網路篇】--RNN遞迴神經網路初始與詳解
2018-05-13
神經網路RNN遞迴
WGCNA構建基因共表達網路詳細教程
2018-08-09
GC
1.2網際網路的網路結構
2020-12-09
TensorFlow系列專題（九）：常用RNN網路結構及依賴優化問題
2018-11-23
RNN優化
轉載：ResNet50網路結構圖及結構詳解
2024-04-03
RNN與LSTM網路簡述
2018-06-10
RNN
迴圈神經網路（RNN）
2020-07-14
神經網路RNN
迴圈神經網路 RNN
2020-12-21
神經網路RNN
TensorFlow卷積網路常用函式引數詳細總結
2019-01-14
卷積函式
關於物聯網網路架構技術中各層的詳細學習
2024-12-09
架構
Linux 目錄結構及詳細操作
2021-12-13
Linux
網路安全Bypass網路卡詳細講解
2021-12-27
RNN神經網路模型綜述
2019-05-10
RNN神經網路模型
Android技能樹 — 網路小結(7)之 Retrofit原始碼詳細解析
2018-12-24
Android原始碼
再用RNN神經網路架構設計生成式語言模型
2024-12-07
RNN神經網路架構模型
網路爬蟲詳細設計方案
2018-08-17
爬蟲
資料結構知識框架【超詳細】
2020-11-15
資料結構框架
RNN是怎麼從單層網路一步一步構造的？
2018-07-13
RNN
網路拓撲結構
2024-10-13
ResNet詳解：網路結構解讀與PyTorch實現教程
2023-10-29
PyTorch
[總結] 容器技術架構、網路和生態詳解
2018-03-04
架構
Andrew BP 神經網路詳細推導
2021-03-12
神經網路
vue-cli 目錄結構詳細講解
2019-02-16
Vue
網路交換機功能和原理的詳細說明
2022-11-30
網路管理體系結構
2024-03-27
迴圈神經網路（Recurrent Neural Network，RNN）
2018-08-22
神經網路RNN
（一）線性迴圈神經網路（RNN）
2019-02-21
神經網路RNN
計算機網路的七層結構、五層結構和四層結構
2021-02-11
計算機網路
Android技能樹 — 網路小結(1)之網路體系結構
2018-07-31
Android
詳細瞭解 InnoDB 記憶體結構及其原理
2021-04-13
記憶體
深度殘差收縮網路：（三）網路結構
2019-12-20
詳細分析連結串列的資料結構的實現過程（Java 實現）
2020-08-31
資料結構Java

詳細展示RNN的網路結構

相關文章