在pytorch框架下，訓練model過程中，loss=nan問題時該怎麼解決？

JSLS_Hf發表於2018-08-16

原文網址 : https://blog.csdn.net/JSLS_Hf/article/details/81743045

當我在UCF-101資料集訓練alexnet時，epoch設為100，跑到三十多個epoch時，出現了loss=nan問題，當時是一臉懵逼，在查閱資料後，我通過減小學習率解決了問題，現總結一下出現這個問題的可能原因及解決方法：

1. 減小整體學習率。學習率比較大的時候，引數可能over shoot了，結果就是找不到極小值點；
減小學習率可以讓引數朝著極值點前進；
2. 改變網路寬度。有可能是網路後面的層引數更新異常，增加後面層的寬度試試；
3. 改變層的學習率。每個層都可以設定學習率，可以嘗試減小後面層的學習率試試；
4. 資料歸一化（減均值，除方差，或者加入normalization，例如BN、L2 norm等）；
5. 加入gradient clipping；
6 輸入資料含有髒資料，即NaN,一般當使用實際業務的真實資料時，容易出現髒資料。

Pytorch訓練時視訊記憶體分配過程探究
2020-12-09
PyTorch記憶體
在pytorch上基於tensorboard的訓練過程的視覺化
2020-10-02
PyTorchORB視覺化
在防護DDoS時會遇到哪些問題，該怎樣解決？
2020-12-01
如何訓練解決問題的能力？
2020-05-28
munium學習過程中問題解決
2024-05-30
通過Observable解決搜尋框問題
2018-10-22
PyTorch 中 loss.grad_fn 解釋
2024-07-20
PyTorch
pytorch訓練GAN時的detach()
2020-11-09
PyTorch
RIME：用交叉熵 loss 大小分辨 preference 是否正確 + 內在獎勵預訓練 reward model
2024-07-25
熵
解說pytorch中的model=model.to(device)
2021-07-11
PyTorchdev
PYTORCH安裝過程以及遇到的問題
2020-09-23
PyTorch
在CSS中解決內容過長的問題
2019-05-08
CSS
bert訓練過程3
2019-01-04
如何解決 Iterative 半監督訓練在 ASR 訓練中難以落地的問題丨RTC Dev Meetup
2022-06-27
dev
深度學習訓練過程中的學習率衰減策略及pytorch實現
2022-03-29
深度學習PyTorch
解決select2 在modal中搜尋框無效的問題
2018-12-11
程式設計謎題：提升你解決問題的訓練場
2021-12-06
程式設計
YOLOv3訓練過程中出現過擬合現象的解決方法
2020-10-21
YOLO
PyTorch 模型訓練實⽤教程（程式碼訓練步驟講解）
2020-09-25
PyTorch模型
amazeUI復擇框問題解決
2018-09-05
UI
OpenPose訓練過程解析（2）
2018-08-24
在製作遊戲的過程中，我都解決和改進了哪些問題
2019-08-09
遊戲
在深度學習訓練過程中如何設定資料增強？
2019-04-30
深度學習
針對ie、safari瀏覽器時間格式化NAN問題解決方法
2018-08-17
瀏覽器NaN
如何使用screen解決ssh斷連訓練停止的問題
2024-03-11
pytorch---在訓練中動態的調整學習率
2019-03-04
PyTorch
pytorch指定GPU訓練
2020-10-16
PyTorchGPU
Pytorch分散式訓練
2022-07-14
PyTorch分散式
記一次 Composer 問題的解決過程！！
2018-08-07
解決Java執行過程中拋簽名異常的問題
2019-01-19
Java
SQL Server 2016升級遷移過程中效能問題解決案例
2019-11-28
SQLServer
Android開發過程中遇到的問題以及解決辦法 how to
2024-07-08
Android
視覺化 Keras 訓練過程
2018-04-08
視覺化Keras
PCIe鏈路層訓練過程
2020-10-25
vue 透過過濾器格式化時間ios出現NaN的問題
2021-09-09
Vue過濾器iOSNaN
Composer 使用過程中遇到的問題和解決方案
2020-05-12
前端怎麼解決跨域問題
2024-06-05
前端跨域
怎麼解決老人養老問題
2022-07-07

在pytorch框架下，訓練model過程中，loss=nan問題時該怎麼解決？

相關文章