在pytorch框架下,訓練model過程中,loss=nan問題時該怎麼解決?
當我在UCF-101資料集訓練alexnet時,epoch設為100,跑到三十多個epoch時,出現了loss=nan問題,當時是一臉懵逼,在查閱資料後,我通過減小學習率解決了問題,現總結一下出現這個問題的可能原因及解決方法:
1. 減小整體學習率。學習率比較大的時候,引數可能over shoot了,結果就是找不到極小值點;
減小學習率可以讓引數朝著極值點前進;
2. 改變網路寬度。有可能是網路後面的層引數更新異常,增加後面層的寬度試試;
3. 改變層的學習率。每個層都可以設定學習率,可以嘗試減小後面層的學習率試試;
4. 資料歸一化(減均值,除方差,或者加入normalization,例如BN、L2 norm等);
5. 加入gradient clipping;
6 輸入資料含有髒資料,即NaN,一般當使用實際業務的真實資料時,容易出現髒資料。
相關文章
- 開發過程中遇到問題該怎麼辦?
- Pytorch訓練時視訊記憶體分配過程探究PyTorch記憶體
- 在防護DDoS時會遇到哪些問題,該怎樣解決?
- 如何訓練解決問題的能力?
- munium學習過程中問題解決
- 在pytorch上基於tensorboard的訓練過程的視覺化PyTorchORB視覺化
- 通過Observable解決搜尋框問題
- RIME:用交叉熵 loss 大小分辨 preference 是否正確 + 內在獎勵預訓練 reward model熵
- PyTorch 中 loss.grad_fn 解釋PyTorch
- 該怎麼解決運維定位服務故障問題?運維
- 在PHP中怎麼解決大量資料處理的問題PHP
- 如何解決 Iterative 半監督訓練 在 ASR 訓練中難以落地的問題丨RTC Dev Meetupdev
- 一個lua問題解決過程
- 【mysql】配置MySQL,解決安裝過程中的問題MySql
- 在CSS中解決內容過長的問題CSS
- 深度學習訓練過程中的學習率衰減策略及pytorch實現深度學習PyTorch
- 解說pytorch中的model=model.to(device)PyTorchdev
- PyTorch 模型訓練實⽤教程(程式碼訓練步驟講解)PyTorch模型
- 在深度學習訓練過程中如何設定資料增強?深度學習
- 程式設計謎題:提升你解決問題的訓練場程式設計
- OpenPose訓練過程解析(2)
- YOLOv3訓練過程中出現過擬合現象的解決方法YOLO
- PYTORCH安裝過程以及遇到的問題PyTorch
- 在製作遊戲的過程中,我都解決和改進了哪些問題遊戲
- 在yazd論壇裡面怎麼解決中文問題?
- pytorch---在訓練中動態的調整學習率PyTorch
- 針對ie、safari瀏覽器時間格式化NAN問題解決方法瀏覽器NaN
- 如何使用screen解決ssh斷連訓練停止的問題
- Pytorch分散式訓練PyTorch分散式
- Mysql安裝過程中遇到的問題及解決辦法MySql
- 視覺化 Keras 訓練過程視覺化Keras
- oracle儲存過程!解決網友問題Oracle儲存過程
- Data Pump Import速度問題之解決過程Import
- amazeUI復擇框問題解決UI
- 程式設計師面試過程中,該怎麼判斷該公司好壞?程式設計師面試
- 程式設計師面試過程中,該怎麼判斷該公司好壞程式設計師面試
- 怎麼解決老人養老問題
- 前端怎麼解決跨域問題前端跨域