神經網路常見引數解釋：epoch、batch、batch size、step、iteration

疯狂学习GIS發表於2024-05-30

原文網址 : https://www.cnblogs.com/fkxxgis/p/18223108

本文介紹在機器學習、深度學習的神經網路模型中，epoch、batch、batch size、step與iteration等名詞的具體含義。

epoch：表示將訓練資料集中的所有樣本都過一遍（且僅過一遍）的訓練過程。在一個epoch中，訓練演算法會按照設定的順序將所有樣本輸入模型進行前向傳播、計算損失、反向傳播和引數更新。一個epoch通常包含多個step。

batch：一般翻譯為“批次”，表示一次性輸入模型的一組樣本。在神經網路的訓練過程中，訓練資料往往是很多的，比如幾萬條甚至幾十萬條——如果我們一次性將這上萬條的資料全部放入模型，對計算機效能、神經網路模型學習能力等的要求太高了；那麼就可以將訓練資料劃分為多個batch，並隨後分批將每個batch的樣本一起輸入到模型中進行前向傳播、損失計算、反向傳播和引數更新。但要注意，一般batch這個詞用的不多，多數情況大家都是隻關注batch size的。

batch size：一般翻譯為“批次大小”，表示訓練過程中一次輸入模型的一組樣本的具體樣本數量。前面提到了，我們在神經網路訓練過程中，往往需要將訓練資料劃分為多個batch；而具體每一個batch有多少個樣本，那麼就是batch size指定的了。

step：一般翻譯為“步驟”，表示在一個epoch中模型進行一次引數更新的操作。通俗地說，在神經網路訓練過程中，每次完成對一個batch資料的訓練，就是完成了一個step。很多情況下，step和iteration表示的是同樣的含義。

iteration：一般翻譯為“迭代”，多數情況下就表示在訓練過程中經過一個step的操作。一個iteration包括了一個step中前向傳播、損失計算、反向傳播和引數更新的流程。當然，在某些情況下，step和iteration可能會有細微的區別——有時候iteration是指完成一次前向傳播和反向傳播的過程，而step是指透過最佳化演算法對模型引數進行一次更新的操作。但是絕大多數情況下，我們就認為二者是一樣的即可。

以上是對這些名詞的解釋，我們將他們帶入實際的例子就更好理解了。

假設我們現在有一個訓練資料集（這個資料集不包括測試集），其中資料的樣本數量為1500。那麼，我們將這1500條資料全部訓練1次，就是一個epoch。其中，由於資料量較大（其實1500個樣本在神經網路研究中肯定不算大，但是我們這裡只是一個例子，大家理解即可），因此我們希望將其分為多個batch，分批加以訓練；我們決定每1批訓練100條資料，那麼為了將這些資料全部訓練完，就需要訓練15批——在這裡，batch size就是100，而batch就是15。而前面我們提到，每次完成對一個batch資料的訓練，就是完成了一個step，那麼step和iteration就也都是15。

以上是我們對這一資料集加以1次訓練（1個epoch）的情況，而一般情況下我們肯定是需要訓練多次的，也就是多個epoch。我們假設我們需要訓練3個epoch，相當於需要將這1500個樣本訓練3次。那麼，step和iteration都會隨著epoch的改變而發生改變——二者都變為45，因為15 * 3。但是，batch依然是15，因為其是在每一個epoch的視角內來看待的，和epoch的具體大小沒有關係。

至此，大功告成。

神經網路深度學習專業術語解釋（Step， Batch Size， Iteration，Epoch）
2020-12-03
神經網路深度學習BAT
神經網路訓練的三個基本概念Epoch, Batch, Iteration
2019-05-20
神經網路BAT
batch、epoch、iteration的區別
2020-10-17
BAT
訓練神經網路時如何確定batch size？
2018-07-12
神經網路BAT
關於深度學習上的一些術語: Epoch, Batch Size, Iteration
2020-12-14
深度學習BAT
深度學習當中的三個概念：Epoch, Batch, Iteration
2020-11-20
深度學習BAT
Batch Normalization: 如何更快地訓練深度神經網路
2019-04-18
BATORM神經網路
深度學習之step by step搭建神經網路
2022-11-19
深度學習神經網路
pytorch dataloader和batch_size大小的理解
2020-10-28
PyTorchBAT
陪你解讀Spring Batch（一）Spring Batch介紹
2019-02-18
SpringBAT
谷歌力作：神經網路訓練中的Batch依賴性很煩？那就消了它！
2020-04-06
谷歌神經網路BAT
常見迴圈神經網路結構
2021-03-24
神經網路
7、超引數除錯、Batch正則化
2024-10-01
除錯BAT
吳恩達《優化深度神經網路》課程筆記（3）– 超引數除錯、Batch正則化和程式設計框架
2018-07-31
吳恩達優化神經網路筆記除錯BAT程式設計框架
陪你解讀Spring Batch（二）帶你入手Spring Batch
2019-02-21
SpringBAT
如何除錯神經網路引數
2020-04-06
除錯神經網路
吳恩達《最佳化深度神經網路》課程筆記（3）– 超引數除錯、Batch正則化和程式設計框架
2018-07-31
吳恩達神經網路筆記除錯BAT程式設計框架
解毒batch normalization
2020-04-06
BATORM
Batch Scripting Tutorial
2024-07-16
BAT
18-神經網路-自定義帶引數的層
2024-08-25
神經網路
使用python基本庫程式碼實現神經網路常見層
2024-07-04
Python神經網路
Spring Batch 簡介
2024-07-09
SpringBAT
Learning with Mini-Batch
2023-03-22
BAT
Tensorflow儲存神經網路引數有妙招：Saver和Restore
2021-09-13
神經網路REST
卷積神經網路的引數量和計算量
2020-11-26
卷積神經網路
【神經網路篇】--RNN遞迴神經網路初始與詳解
2018-05-13
神經網路RNN遞迴
梯度累計講解-支援更大的batch
2024-08-07
梯度BAT
TensorFlow實現Batch Normalization
2020-04-06
BATORM
Spring Boot整合Spring Batch
2019-05-09
Spring BootBAT
Batch入門教程（2）
2019-02-17
BAT
codeurjc/spring-mail-batch：使用Spring Batch批次傳送電子郵件
2019-01-14
SpringAIBAT
神經網路簡介--啟用函式、網路架構、生物模型解釋
2021-09-09
神經網路函式架構模型
神經網路：numpy實現神經網路框架
2021-08-19
神經網路框架
神經網路
2018-11-30
神經網路
maven “Generating project in Batch mode“問題的解決
2020-11-21
MavenProjectBAT
深度學習中的epochs，batch_size，iterations詳解---對這三個概念說的比較清楚
2018-06-18
深度學習BAT
介面壓測實踐-壓力測試常見引數解釋說明
2023-01-11
大力再出奇蹟，1024 張TPU，65536 batch size，僅76分鐘訓練完BERT！
2019-04-04
BAT

神經網路常見引數解釋：epoch、batch、batch size、step、iteration

相關文章