DeepMind丟掉了歸一化,讓影像識別訓練速度提升了8.7倍 | 已開源
金磊 發自 凹非寺
量子位 報導 | 公眾號 QbitAI
在大規模影像識別任務上,DeepMind的新方法火了。
不僅拿到了SOTA,訓練速度還提升了8.7倍之多!
方法關鍵:去“批處理歸一化”
對於大多數影像識別模型來說,批處理歸一化(batch normalization)是非常重要的組成部分。
但與此同時,這樣的方式也存在一定的侷限性,那就是它存在許多並不重要的特徵。
雖然近期的一些研究在沒有歸一化的情況下,成功訓練了深度ResNet,但這些模型與最佳批處理歸一化網路的測試精度不相匹配。
而這便是DeepMind此次研究所要解決的問題——提出了一種自適應梯度剪裁 (AGC) 技術。
具體而言,這是一種叫做Normalizer-Free ResNet (NFNet)的新網路。
整體來看,NFNet的整體結構如上圖所示。
以有無“transition塊”來劃分,可以再細分為2種情況。
其中,它們的bottleneck ratio均設定為0.5,且在3 x 3的卷積中,無論通道的數量為多少,組寬都固定為128。
二者的區別在於skip path接收訊號的方式,左側的是在用β進行variance downscaling和縮放非線性之後;而右側則是在用β進行variance downscaling之前完成。
實驗結果
在實驗部分,DeepMind的研究人員,採用了與NFNet相關的7個模型做了對比實驗,分別是NFNet-F0至NFNet-F6。
不難看出,在各個模型的對比過程中,在Top-1精度方面均取得了最好結果。
值得一提的是,與EfficientNet-B7相比,訓練速度方面提升了8.7倍之多。
此外,在對3億張標記影像進行大規模預訓練後,在ImageNet上還取得了89.2%的Top-1精度。
最後,對於這項研究的程式碼,也已在GitHub上開源。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69971123/viewspace-2757419/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- DeepMind讓AI組隊踢足球學會“合作”,並開源訓練環境AI
- 影像歸一化
- 貓狗識別訓練
- 海南話語音識別模型——模型訓練(一)模型
- 視覺化影像處理 | 視覺化訓練器 | 影像分類視覺化
- Yolov8訓練識別模型YOLO模型
- 讓PyTorch訓練速度更快,你需要掌握這17種方法PyTorch
- DeepMind開源強化學習庫TRFL強化學習
- 百度定製化影像開放平臺訓練評測
- DeepMind 訓練了一個人工智慧來控制核聚變人工智慧
- 1分鐘訓練百萬級別節點嵌入,Mila開源圖嵌入訓練系統GraphViteMILAVite
- 美國「返利網」開源sk-dist框架將sklearn訓練速度提升數倍框架
- OCR訓練中文樣本庫和識別
- 讓數百萬臺手機訓練同一個模型?Google把這套框架開源了模型Go框架
- 飛槳PaddlePaddle單機訓練速度優化最佳實踐優化
- 影像識別
- 飛槳PaddlePaddle單機訓練速度最佳化最佳實踐
- ICLR 2024 | 無需訓練,Fast-DetectGPT讓文字檢測速度提升340倍ICLRASTGPT
- orange影像識別
- python影像識別Python
- 曾爆火的 InstantID又有了新玩法:風格化影像生成,已開源
- 1分鐘訓練百萬級別節點嵌入,加拿大Mila研究所開源圖嵌入訓練系統GraphViteMILAVite
- 訓練營 | 如何成為一名開源社群貢獻者?
- 吐血推薦清華大學表情識別翹楚之作(已開源)
- 使用DeepKE訓練命名實體識別模型DEMO(官方DEMO)模型
- 文字識別(四)--大批量生成文字訓練集
- 影像識別技術
- DeepMind圖網路庫開源了!
- CANN訓練:模型推理時資料預處理方法及歸一化引數計算模型
- AppUI 自動化中的影像識別的使用APPUI
- 訓練一個影像分類器demo in PyTorch【學習筆記】PyTorch筆記
- 首個基於Mamba的MLLM來了!模型權重、訓練程式碼等已全部開源模型
- 完勝 BERT,谷歌最佳 NLP 預訓練模型開源,單卡訓練僅需 4 天谷歌模型
- 影像篡改與識別(一):膠片時代
- 網易開源支援影像識別的自動化UI測試工具,零基礎親測好評!UI
- PaddleOCR手寫文字識別模型訓練(摘抄所得,非原創)模型
- Python實現AI影像識別-身份證識別PythonAI
- pytorch入門2.2構建迴歸模型初體驗(開始訓練)PyTorch模型