深度學習訓練時網路不收斂的原因分析總結
轉自:https://blog.csdn.net/comway_Li/article/details/81878400
很多同學會發現,為什麼我訓練網路的時候loss一直居高不下或者準確度時高時低,震盪趨勢,一會到11,一會又0.1,不收斂。 又不知如何解決,博主總結了自己訓練經驗和看到的一些方法。
首先你要保證訓練的次數夠多,不要以為一百兩百次就會一直loss下降或者準確率一直提高,會有一點震盪的。只要總體收斂就行。若訓練次數夠多(一般上千次,上萬次,或者幾十個epoch)沒收斂,則試試下面方法:
1. 資料和標籤
資料分類標註是否準確?資料是否乾淨?資料庫太小一般不會帶來不收斂的問題,只要你一直在train總會收斂(rp問題跑飛了不算)。反而不收斂一般是由於樣本的資訊量太大導致網路不足以fit住整個樣本空間。樣本少只可能帶來過擬合的問題
2. 學習率設定不合理
在自己訓練新網路時,可以從0.1開始嘗試,如果loss不下降的意思,那就降低,除以10,用0.01嘗試,一般來說0.01會收斂,不行的話就用0.001. 學習率設定過大,很容易震盪。不過剛剛開始不建議把學習率設定過小,尤其是在訓練的開始階段。在開始階段我們不能把學習率設定的太低否則loss不會收斂。我的做法是逐漸嘗試,從0.1,0.08,0.06,0.05 ......逐漸減小直到正常為止,
有的時候候學習率太低走不出低估,把衝量提高也是一種方法,適當提高mini-batch值,使其波動不大。,
3.網路設定不合理
如果做很複雜的分類任務,卻只用了很淺的網路,可能會導致訓練難以收斂,換網路換網路換網路,重要的事情說三遍,或者也可以嘗試加深當前網路。
4.資料集label的設定
檢查lable是否有錯,有的時候影象類別的label設定成1,2,3正確設定應該為0,1,2。
5、改變圖片大小
博主看到一篇文章,說改變圖片大小可以解決收斂問題,具體博主沒試過,只看到有這個方法,具體文章連結:https://blog.csdn.net/Fighting_Dreamer/article/details/71498256
感興趣的可以去看看。
6、資料歸一化
神經網路中對資料進行歸一化是不可忽略的步驟,網路能不能正常工作,還得看你有沒有做歸一化,一般來講,歸一化就是減去資料平均值除以標準差,通常是針對每個輸入和輸出特徵進行歸一化
---------------------
作者:搞視覺的張小凡
來源:CSDN
原文:https://blog.csdn.net/comway_Li/article/details/81878400
版權宣告:本文為博主原創文章,轉載請附上博文連結!
相關文章
- 神經網路不收斂的 11 個原因神經網路
- 深度學習 | 訓練網路trick——mixup深度學習
- 如何調整一個不收斂的神經網路神經網路
- 深度學習煉丹-超引數設定和網路訓練深度學習
- 深度學習與CV教程(6) | 神經網路訓練技巧 (上)深度學習神經網路
- 深度神經網路的分散式訓練概述:常用方法和技巧全面總結神經網路分散式
- 雲端計算時代的深度學習訓練深度學習
- 神經網路與深度學習 課程複習總結神經網路深度學習
- 《神經網路和深度學習》系列文章三十八:深度神經網路為何很難訓練?神經網路深度學習
- ICLR 2019 | 用淺度學習訓練深度網路:避開端到端深度學習難題ICLR深度學習
- 研學社·系統組 | 實時深度學習的推理加速和持續訓練深度學習
- 深度神經網路為何很難訓練?神經網路
- 初創公司如何訓練大型深度學習模型深度學習模型
- NLP與深度學習(五)BERT預訓練模型深度學習模型
- ENVI深度學習隨機引數訓練方法深度學習隨機
- 零基礎入門深度學習(一):用numpy實現神經網路訓練深度學習神經網路
- Batch Normalization: 如何更快地訓練深度神經網路BATORM神經網路
- 動手學深度學習第十四課:實現、訓練和應用迴圈神經網路深度學習神經網路
- 1.23訓練總結
- 網路、HTTP相關學習總結HTTP
- 關於訓練神經網路的諸多技巧Tricks(完全總結版)神經網路
- 深度學習-Tensorflow2.2-預訓練網路{7}-遷移學習基礎針對小資料集-19深度學習遷移學習
- [原始碼解析] 深度學習分散式訓練框架 horovod (13) --- 彈性訓練之 Driver原始碼深度學習分散式框架
- Siamese RPN 訓練網路結構解析
- 《深度學習案例精粹:基於TensorFlow與Keras》案例集用於深度學習訓練深度學習Keras
- [原始碼解析] 深度學習分散式訓練框架 horovod (4) --- 網路基礎 & Driver原始碼深度學習分散式框架
- 深度學習一:深度前饋網路深度學習
- 深度學習系列(2)——神經網路與深度學習深度學習神經網路
- 深度學習模型調參總結深度學習模型
- 深度學習調參tricks總結!深度學習
- 深度學習調參tricks總結深度學習
- 機器學習、深度學習資源總結機器學習深度學習
- 基於Theano的深度學習框架keras及配合SVM訓練模型深度學習框架Keras模型
- 特斯拉AI主管給你的33條深度學習訓練建議AI深度學習
- 當前訓練神經網路最快的方式:AdamW優化演算法+超級收斂神經網路優化演算法
- 基於深度學習的網路表示深度學習
- 3.3 神經網路的訓練神經網路
- 網路安全培訓多少錢?學習時間是多久?