TensorFlow框架下的RNN實踐小結

weixin_34321977發表於2017-11-21

截至目前，TensorFlow的RNN APIs還處於Draft階段。不過據官方解釋，RNN的相關API已經出現在Tutorials裡了，大幅度的改動應該是不大可能，現在入手TF的RNN APIs風險應該是不大的。

目前TF的RNN APIs主要集中在tensorflow.models.rnn中的rnn和rnn_cell兩個模組。其中，後者定義了一些常用的RNN cells，包括RNN和優化的LSTM、GRU等等；前者則提供了一些helper方法。

建立一個基礎的RNN很簡單：

1
from tensorflow.models.rnn import rnn_cell

2
cell = rnn_cell.BasicRNNCell(inputs, state)

建立一個LSTM或者GRU的cell？

1
cell = rnn_cell.BasicLSTMCell(num_units)  #最最基礎的，不帶peephole。

2
cell = rnn_cell.LSTMCell(num_units, input_size)  #可以設定peephole等屬性。

3
cell = rnn_cell.GRUCell(num_units)

呼叫呢？

1
output, state = cell(input, state)

這樣自己按timestep呼叫需要設定variable_scope的reuse屬性為True，懶人怎麼做，TF也給想好了：

1
state = cell.zero_state(batch_size, dtype=tf.float32)

2
outputs, states = rnn.rnn(cell, inputs, initial_state=state)

再懶一點：

1
outputs, states = rnn.rnn(cell, inputs, dtype=tf.float32)

怕overfit，加個Dropout如何？

1
cell = rnn_cell.DropoutWrapper(cell, input_keep_prob=0.5, output_keep_prob=0.5)

做個三層的帶Dropout的網路？

1
cell = rnn_cell.DropoutWrapper(cell, output_keep_prob=0.5)

2
cell = rnn_cell.MultiRNNCell([cell] * 3)

3
inputs = tf.nn.dropout(inputs, 0.5)  #給第一層單獨加個Dropout。

一個坑——用rnn.rnn要按照timestep來轉換一下輸入資料，比如像這樣：

1
inputs = [tf.reshape(t, (input_dim[0], 1)) for t in tf.split(1, input_dim[1], inputs)]

rnn.rnn()的輸出也是對應每一個timestep的，如果只關心最後一步的輸出，取outputs[-1]即可。

注意一下子返回值的dimension和對應關係，損失函式和其它情況沒有大的區別。

目前飽受詬病的是TF本身還不支援Theano中scan()那樣可以輕鬆實現的不定長輸入的RNN，不過有人反饋說Theano中不定長訓練起來還不如提前給inputs加個padding改成定長的訓練快。

[譯] TensorFlow 中的 RNN 串流
2018-10-20
RNN
TensorFlow中RNN實現的正確開啟方式
2018-01-29
RNN
Vue 實踐小結
2019-02-27
Vue
小程式實踐小坑小結（一）
2018-08-02
Tensorflow實現RNN（LSTM）手寫數字識別
2018-05-27
RNN
RNN程式碼解讀之char-RNN with TensorFlow(model.py)
2018-05-27
RNN
小程式初實踐總結
2019-12-30
Java最佳實踐小結 - jonathangiles
2021-11-24
Java
TensorFlow分散式實踐
2019-01-16
分散式
小程式開發實踐總結
2018-08-22
TensorFlow系列專題（八）：七步帶你實現RNN迴圈神經網路小示例
2018-11-22
RNN神經網路
div+contenteditable 實現富文字釋出框的小結
2019-03-10
使用Keras進行深度學習：（五）RNN和雙向RNN講解及實踐
2018-04-26
Keras深度學習RNN
SixLabors.ImageSharp 實踐小結
2020-11-23
Mpvue 小程式轉 Web 實踐總結
2018-03-26
VueWeb
人工智慧實踐：Tensorflow筆記：程式碼總結（2）
2020-09-30
人工智慧筆記
解讀tensorflow之rnn 的示例 ptb_word_lm.py
2017-06-19
RNN
微信小程式Video元件實踐總結
2019-01-28
微信小程式IDE元件
RNN 結構詳解
2018-12-14
RNN
Flutter實踐：深入 Flutter 的狀態管理方式(3)——旅途小結與Redux實踐
2019-02-09
FlutterRedux
RNN的PyTorch實現
2022-11-19
RNNPyTorch
當微信小程式遇上TensorFlow：小程式實現
2018-10-08
微信小程式
tensorflow教程:tf.contrib.rnn.DropoutWrapper
2018-11-25
RNNAPP
TensorFlow系列專題（九）：常用RNN網路結構及依賴優化問題
2018-11-23
RNN優化
TCP KeepAlive機制理解與實踐小結
2022-01-03
TCP
詳細展示RNN的網路結構
2018-09-17
RNN
小程式TodoList實踐
2019-03-03
Vue 小專案的最佳實踐
2017-04-18
Vue
微信小程式的思考與實踐
2017-01-15
微信小程式
HTTP/1.x 及 Service Worker 快取實踐小結
2018-12-17
HTTP快取
《Android和PHP開發最佳實踐》一3.7　小結
2017-08-01
AndroidPHP
小程式優化實踐
2018-11-29
優化
讀書小組實踐
2018-05-14
【小程式】微信小程式開發實踐
2016-11-07
微信小程式
當微信小程式遇上TensorFlow：Server端實現
2019-03-02
微信小程式Server
TensorFlow搭建神經網路最佳實踐樣例
2020-04-06
神經網路
樹莓派上利用Tensorflow實現小車的自動駕駛
2019-01-17
樹莓派自動駕駛
Java服務端開發非同步化實踐的一點小結
2019-02-27
Java服務端非同步

TensorFlow框架下的RNN實踐小結

相關文章