神經網路訓練的三個基本概念Epoch, Batch, Iteration

dicksonjyl560101發表於2019-05-20

原文網址 : http://blog.itpub.net/29829936/viewspace-2644889/

神經網路BAT

https://www.toutiao.com/a6692677965379011079/

深度神經網路的優化都是基本都是基於梯度下降的，梯度下降的過程就是尋找函式值下降速度最快的方向，沿著該方向迭代，快速到達區域性最優解的過程。

梯度下降更新引數的方式最常見的有三種:

1. 批量梯度下降(Batch Gradient Descent)

每一次迭代時使用整個訓練集的資料計算Cost Function來進行梯度更新。

由於每一次引數更新都用到所有的訓練集資料，當樣本數量很大的時候，計算開銷大，速度慢。

2.隨機梯度下降(Stochastic Gradient Descent)

每一次迭代時，針對單個樣本計算Loss Function，然後計算梯度更新引數。這種方法速度比較快，但是收斂效能不好，可能造成目標函式劇烈震盪，並且大資料集的相似樣本會造成梯度的冗餘計算。

3.小批量梯度下降(Mini-Batch Gradient Descent)

每次迭代時，採用一小批樣本，一方面這樣可以降低引數更新時的方差，收斂更加穩定，另一方面可以充分利用深度學習庫中的高度優化的矩陣操作進行有效的梯度計算。

Mini-Batch Gradient Descent並不能保證很好的收斂性，Learning Rate 如果選擇的太小，收斂速度會很慢；如果選擇的太大，Loss Function可能在區域性最優解附近不停地震盪甚至偏離。有一種措施是先設定大一點的學習率，當兩次迭代之間的變化低於某個閾值後，就減小Learning Rate。

在大規模的神經網路訓練中，一般採用小批量梯度下降的方式。 Batch Epoch Iteration 就是其中的重要的概念。

1.Batch

每次迭代時使用的一批樣本就叫做一個Batch，樣本的數量稱為Batch Size。Batch大小是一個超引數，用於定義在更新內部模型引數之前要處理的樣本數。深度學習每一次引數的更新的Loss Function並不是由一個樣本得到的，而是由一個Batch的資料加權得到。

2. Iteration

使用Batch Size個樣本訓練一次的過程叫做一個Iteration。

3. Epoch

一個epoch就是使用訓練集中的全部樣本訓練一次。通俗的講，Epoch的值就是整個訓練資料集被反覆使用幾次。

Epoch數是一個超引數，它定義了學習演算法在整個訓練資料集中的工作次數。一個Epoch意味著訓練資料集中的每個樣本都有機會更新內部模型引數。Epoch由一個或多個Batch組成。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/29829936/viewspace-2644889/，如需轉載，請註明出處，否則將追究法律責任。

神經網路常見引數解釋：epoch、batch、batch size、step、iteration
2024-05-30
神經網路BAT
神經網路深度學習專業術語解釋（Step， Batch Size， Iteration，Epoch）
2020-12-03
神經網路深度學習BAT
batch、epoch、iteration的區別
2020-10-17
BAT
深度學習當中的三個概念：Epoch, Batch, Iteration
2020-11-20
深度學習BAT
訓練神經網路時如何確定batch size？
2018-07-12
神經網路BAT
Batch Normalization: 如何更快地訓練深度神經網路
2019-04-18
BATORM神經網路
3.3 神經網路的訓練
2019-12-31
神經網路
谷歌力作：神經網路訓練中的Batch依賴性很煩？那就消了它！
2020-04-06
谷歌神經網路BAT
訓練自己的Android TensorFlow神經網路
2020-10-25
Android神經網路
用神經網路測量訓練集的半衰期
2020-11-14
神經網路
如何應對訓練的神經網路不工作？
2020-04-06
神經網路
使用tf.estimator.Estimator訓練神經網路
2018-09-16
神經網路
關於深度學習上的一些術語: Epoch, Batch Size, Iteration
2020-12-14
深度學習BAT
從零開始：教你如何訓練神經網路
2019-02-16
神經網路
umich cv-5-1 神經網路訓練1
2023-10-28
神經網路
umich cv-5-2 神經網路訓練2
2023-10-28
神經網路
機器學習之訓練神經網路：最佳做法
2020-06-28
機器學習神經網路
【python實現卷積神經網路】開始訓練
2020-04-18
Python卷積神經網路
送你9個快速使用Pytorch訓練解決神經網路的技巧（附程式碼）
2019-08-22
PyTorch神經網路
如何入門Pytorch之四：搭建神經網路訓練MNIST
2020-09-13
PyTorch神經網路
面向統一的AI神經網路架構和預訓練方法
2023-05-08
AI神經網路架構
神經網路之反向傳播訓練(8行程式碼)
2018-05-23
神經網路反向傳播行程
深度學習與CV教程(6) | 神經網路訓練技巧 (上)
2022-06-01
深度學習神經網路
迴圈神經網路之embedding，padding，模型構建與訓練
2021-03-02
神經網路padding模型
Yelp訓練了一個神經網路來debug，然後就被這個AI刪庫了
2019-01-16
神經網路AI
關於訓練神經網路的諸多技巧Tricks(完全總結版)
2018-11-09
神經網路
三、淺層神經網路
2024-09-16
神經網路
在Python中使用OpenCV訓練神經網路來檢測手勢！
2018-12-18
PythonOpenCV神經網路
使用人工神經網路訓練手寫數字識別模型
2023-10-09
神經網路模型
深度神經網路的分散式訓練概述：常用方法和技巧全面總結
2018-11-05
神經網路分散式
composer：2-4倍加速神經網路訓練的演算法庫
2022-03-20
神經網路演算法
使用 PyTorch 構建和訓練一個卷積神經網路進行影像分類任務
2024-06-27
PyTorch卷積神經網路
ICLR 2024 Oral｜用巧妙的「傳送」技巧，讓神經網路的訓練更加高效
2024-05-09
ICLR神經網路
谷歌開源Neural Tangents：簡單快速訓練無限寬度神經網路
2020-04-17
谷歌神經網路
迴圈神經網路設計同樣可以使用預訓練詞“嵌入”
2024-12-02
神經網路
神經網路：numpy實現神經網路框架
2021-08-19
神經網路框架
神經網路不收斂的 11 個原因
2021-05-04
神經網路
神經網路
2018-11-30
神經網路

神經網路訓練的三個基本概念Epoch, Batch, Iteration

相關文章