在pytorch框架下,訓練model過程中,loss=nan問題時該怎麼解決?
當我在UCF-101資料集訓練alexnet時,epoch設為100,跑到三十多個epoch時,出現了loss=nan問題,當時是一臉懵逼,在查閱資料後,我通過減小學習率解決了問題,現總結一下出現這個問題的可能原因及解決方法:
1. 減小整體學習率。學習率比較大的時候,引數可能over shoot了,結果就是找不到極小值點;
減小學習率可以讓引數朝著極值點前進;
2. 改變網路寬度。有可能是網路後面的層引數更新異常,增加後面層的寬度試試;
3. 改變層的學習率。每個層都可以設定學習率,可以嘗試減小後面層的學習率試試;
4. 資料歸一化(減均值,除方差,或者加入normalization,例如BN、L2 norm等);
5. 加入gradient clipping;
6 輸入資料含有髒資料,即NaN,一般當使用實際業務的真實資料時,容易出現髒資料。
相關文章
- Pytorch訓練時視訊記憶體分配過程探究PyTorch記憶體
- 在pytorch上基於tensorboard的訓練過程的視覺化PyTorchORB視覺化
- 在防護DDoS時會遇到哪些問題,該怎樣解決?
- 如何訓練解決問題的能力?
- munium學習過程中問題解決
- 通過Observable解決搜尋框問題
- PyTorch 中 loss.grad_fn 解釋PyTorch
- pytorch訓練GAN時的detach()PyTorch
- RIME:用交叉熵 loss 大小分辨 preference 是否正確 + 內在獎勵預訓練 reward model熵
- 解說pytorch中的model=model.to(device)PyTorchdev
- PYTORCH安裝過程以及遇到的問題PyTorch
- 在CSS中解決內容過長的問題CSS
- bert訓練過程3
- 如何解決 Iterative 半監督訓練 在 ASR 訓練中難以落地的問題丨RTC Dev Meetupdev
- 深度學習訓練過程中的學習率衰減策略及pytorch實現深度學習PyTorch
- 解決select2 在modal中搜尋框無效的問題
- 程式設計謎題:提升你解決問題的訓練場程式設計
- YOLOv3訓練過程中出現過擬合現象的解決方法YOLO
- PyTorch 模型訓練實⽤教程(程式碼訓練步驟講解)PyTorch模型
- OpenPose訓練過程解析(2)
- amazeUI復擇框問題解決UI
- 在深度學習訓練過程中如何設定資料增強?深度學習
- 在製作遊戲的過程中,我都解決和改進了哪些問題遊戲
- 針對ie、safari瀏覽器時間格式化NAN問題解決方法瀏覽器NaN
- 如何使用screen解決ssh斷連訓練停止的問題
- pytorch---在訓練中動態的調整學習率PyTorch
- pytorch指定GPU訓練PyTorchGPU
- Pytorch分散式訓練PyTorch分散式
- 記一次 Composer 問題的解決過程!!
- 解決Java執行過程中拋簽名異常的問題Java
- SQL Server 2016升級遷移過程中效能問題解決案例SQLServer
- Android開發過程中遇到的問題以及解決辦法 how toAndroid
- 視覺化 Keras 訓練過程視覺化Keras
- PCIe鏈路層訓練過程
- vue 透過過濾器格式化時間ios出現NaN的問題Vue過濾器iOSNaN
- Composer 使用過程中遇到的問題和解決方案
- 前端怎麼解決跨域問題前端跨域
- 怎麼解決老人養老問題