TensorFlow筆記(5)——優化手寫數字識別模型之優化器

僱個城管打天下發表於2018-12-12

原文網址 : https://juejin.im/post/5c10c586e51d4556c90bd796

什麼是優化器（Optimizer）

神經網路越複雜 , 資料量越大 , 我們需要在訓練神經網路的過程上花費的時間也就越多. 原因很簡單, 就是因為計算量太大了. 可是往往有時候為了解決複雜的問題, 複雜的結構和大資料又是不能避免的, 所以我們需要尋找一些方法, 讓神經網路聰明起來, 快起來。那些可以加速神經網路訓練的方法就叫做優化器（Optimizer）推薦閱讀：加速神經網路訓練 (Speed Up Training)

常見的優化器

這個部分的理論知識實在太多了，我簡單的整理了一點點，詳見機器學習：各種優化器Optimizer的總結與比較下面是TensorFlow中提供的相關優化器的API

tf.train.GradientDescentOptimizer
tf.train.AdadeltaOptimizer
tf.train.AdagradOptimizer
tf.train.AdagradDAOptimizer
tf.train.MomentumOptimizer
tf.train.AdamOptimizer
tf.train.FtrlOptimizer
tf.train.ProximalGradientDescentOptimizer
tf.train.ProximalAdagradOptimizer
tf.train.RMSPropOptimizer
複製程式碼

視覺化比較幾個優化器

示例1

上圖比較了6種優化器收斂到目標點（五角星）的執行過程，從圖中可以大致看出： ① 在執行速度方面

兩個動量優化器Momentum和NAG的速度最快，其次是三個自適應學習率優化器AdaGrad、AdaDelta以及RMSProp，最慢的則是SGD。

② 在收斂軌跡方面

兩個動量優化器雖然執行速度很快，但是初中期走了很長的”岔路”。
三個自適應優化器中，Adagrad初期走了岔路，但後來迅速地調整了過來，但相比其他兩個走的路最長；AdaDelta和RMSprop的執行軌跡差不多，但在快接近目標的時候，RMSProp會發生很明顯的抖動。
SGD相比於其他優化器，走的路徑是最短的，路子也比較正。

示例2

上圖在一個存在鞍點的曲面，比較6中優化器的效能表現，從圖中大致可以看出：

三個自適應學習率優化器沒有進入鞍點，其中，AdaDelta下降速度最快，Adagrad和RMSprop則齊頭並進。
兩個動量優化器Momentum和NAG以及SGD都順勢進入了鞍點。但兩個動量優化器在鞍點抖動了一會，就逃離了鞍點並迅速地下降，後來居上超過了Adagrad和RMSProp。
很遺憾，SGD進入了鞍點，卻始終停留在了鞍點，沒有再繼續下降。

如何挑選合適的優化器

其實從上述的兩個視覺化的例子中我們就可以看到SGD的速度應該是最慢的，但是這並不影響他是我們在實際使用中用到的最多的優化器。畢竟在實際使用中速度並不是唯一決定因素，準確率才是。所以說：

在研究除錯我們的神經網路時我們可以使用一些比較快的優化器，例如：Adagrad、RMSProp等
研究的差不多了，模型也搭建好了，此時如果你需要有準確的結果用來發論文等，這時候最好把每一個優化器都使用一遍，因為你也不知道究竟哪個優化器最終得到的結果是最好的，最適合你的網路。

tensorflow.js 手寫數字識別
2024-11-03
JS
AI學習筆記——Tensorflow中的Optimizer(優化器)
2018-08-15
AI筆記優化
Tensorflow實現RNN（LSTM）手寫數字識別
2018-05-27
RNN
Tensorflow2.0-mnist手寫數字識別示例
2020-12-29
【TensorFlow篇】--Tensorflow框架實現SoftMax模型識別手寫數字集
2018-03-28
框架模型
用tensorflow2實現mnist手寫數字識別
2020-11-11
【TensorFlow2.0】LeNet進行手寫體數字識別
2020-10-19
《手寫數字識別》神經網路學習筆記
2020-10-26
神經網路筆記
mnist手寫數字識別——深度學習入門專案（tensorflow+keras+Sequential模型）
2020-08-03
深度學習Keras模型
【機器學習】手寫數字識別
2022-07-04
機器學習
MySQL 優化筆記
2019-11-21
MySql優化筆記
MySQL優化學習筆記之explain
2018-10-25
MySql優化筆記AI
MySQL優化學習筆記之索引
2018-10-22
MySql優化筆記索引
Android 效能優化之記憶體優化
2018-05-21
Android優化記憶體
Android效能優化筆記（一）——啟動優化
2018-12-27
Android優化筆記
MySQL優化之系統變數優化
2018-04-17
MySql優化變數
瀏覽器中的手寫數字識別
2019-04-25
瀏覽器
早餐｜第十七期 · 模型優化器對模型做了哪些優化
2020-09-27
模型優化
Android記憶體優化之圖片優化
2019-03-03
Android記憶體優化
Android效能優化筆記
2019-03-04
Android優化筆記
MySQL 筆記 - 索引優化
2018-08-12
MySql筆記索引優化
Linux 效能優化筆記
2020-01-06
Linux優化筆記
Web 效能優化筆記
2019-11-19
Web優化筆記
ES的優化筆記
2021-07-25
優化筆記
TensorFlow.NET機器學習入門【5】採用神經網路實現手寫數字識別（MNIST）
2021-12-28
機器學習神經網路
Android 效能優化（十二）之我為什麼寫效能優化
2019-03-04
Android優化
斜率優化學習筆記
2021-01-03
優化筆記
【Tensorflow_DL_Note8】MNIST數字識別問題以及神經網路結構設計和引數優化(1)
2018-04-20
神經網路優化
【百度飛槳】手寫數字識別模型部署Paddle Inference
2022-07-16
模型
讀小程式效能優優化實踐-筆記
2020-03-17
優化筆記
sql優化之邏輯優化
2018-12-12
SQL優化
mysql優化之讀寫分離
2018-10-12
MySql優化
高手過招「效能優化/純手寫SpringMVC框架/MySql優化/微服務」
2018-12-05
優化SpringMVC框架MySql微服務
人工智慧進階-TensorFlow核心之剪枝優化
2019-07-04
人工智慧優化
Android效能優化篇之記憶體優化--記憶體洩漏
2018-06-04
Android優化記憶體
TensorFlow－1: 如何識別數字
2021-09-09
Mysql 優化(學習筆記二十)
2018-05-22
MySql優化筆記
慢SQL優化實戰筆記
2020-07-26
SQL優化筆記

TensorFlow筆記(5)——優化手寫數字識別模型之優化器

什麼是優化器（Optimizer）

常見的優化器

視覺化比較幾個優化器

示例1

示例2

如何挑選合適的優化器

相關文章