DeepMind丟掉了歸一化,讓影像識別訓練速度提升了8.7倍 | 已開源
金磊 發自 凹非寺
量子位 報導 | 公眾號 QbitAI
在大規模影像識別任務上,DeepMind的新方法火了。
不僅拿到了SOTA,訓練速度還提升了8.7倍之多!
方法關鍵:去“批處理歸一化”
對於大多數影像識別模型來說,批處理歸一化(batch normalization)是非常重要的組成部分。
但與此同時,這樣的方式也存在一定的侷限性,那就是它存在許多並不重要的特徵。
雖然近期的一些研究在沒有歸一化的情況下,成功訓練了深度ResNet,但這些模型與最佳批處理歸一化網路的測試精度不相匹配。
而這便是DeepMind此次研究所要解決的問題——提出了一種自適應梯度剪裁 (AGC) 技術。
具體而言,這是一種叫做Normalizer-Free ResNet (NFNet)的新網路。
整體來看,NFNet的整體結構如上圖所示。
以有無“transition塊”來劃分,可以再細分為2種情況。
其中,它們的bottleneck ratio均設定為0.5,且在3 x 3的卷積中,無論通道的數量為多少,組寬都固定為128。
二者的區別在於skip path接收訊號的方式,左側的是在用β進行variance downscaling和縮放非線性之後;而右側則是在用β進行variance downscaling之前完成。
實驗結果
在實驗部分,DeepMind的研究人員,採用了與NFNet相關的7個模型做了對比實驗,分別是NFNet-F0至NFNet-F6。
不難看出,在各個模型的對比過程中,在Top-1精度方面均取得了最好結果。
值得一提的是,與EfficientNet-B7相比,訓練速度方面提升了8.7倍之多。
此外,在對3億張標記影像進行大規模預訓練後,在ImageNet上還取得了89.2%的Top-1精度。
最後,對於這項研究的程式碼,也已在GitHub上開源。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69971123/viewspace-2757419/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- DeepMind讓AI組隊踢足球學會“合作”,並開源訓練環境AI
- Yolov8訓練識別模型YOLO模型
- 百度定製化影像開放平臺訓練評測
- DeepMind開源強化學習庫TRFL強化學習
- 美國「返利網」開源sk-dist框架將sklearn訓練速度提升數倍框架
- DeepMind 訓練了一個人工智慧來控制核聚變人工智慧
- 1分鐘訓練百萬級別節點嵌入,Mila開源圖嵌入訓練系統GraphViteMILAVite
- OCR訓練中文樣本庫和識別
- Tesseract-OCR 字元識別---樣本訓練字元
- 讓數百萬臺手機訓練同一個模型?Google把這套框架開源了模型Go框架
- 如何訓練一個簡單的音訊識別網路音訊
- 影像識別
- 飛槳PaddlePaddle單機訓練速度優化最佳實踐優化
- 1分鐘訓練百萬級別節點嵌入,加拿大Mila研究所開源圖嵌入訓練系統GraphViteMILAVite
- leela zero 一種開源的採用alphago zero論文思路的訓練軟體 正在招募訓練者Go
- 訓練營 | 如何成為一名開源社群貢獻者?
- 機器學習之邏輯迴歸:模型訓練機器學習邏輯迴歸模型
- 飛槳PaddlePaddle單機訓練速度最佳化最佳實踐
- 文字識別(四)--大批量生成文字訓練集
- 完勝 BERT,谷歌最佳 NLP 預訓練模型開源,單卡訓練僅需 4 天谷歌模型
- ICLR 2024 | 無需訓練,Fast-DetectGPT讓文字檢測速度提升340倍ICLRASTGPT
- 首個基於Mamba的MLLM來了!模型權重、訓練程式碼等已全部開源模型
- 【sql】訓練一SQL
- DeepMind圖網路庫開源了!
- python影像識別Python
- 影像識別技術
- 網易開源支援影像識別的自動化UI測試工具,零基礎親測好評!UI
- 訓練一個影像分類器demo in PyTorch【學習筆記】PyTorch筆記
- CANN訓練:模型推理時資料預處理方法及歸一化引數計算模型
- 吐血推薦清華大學表情識別翹楚之作(已開源)
- 曾爆火的 InstantID又有了新玩法:風格化影像生成,已開源
- 實驗12-使用keras預訓練模型完成貓狗識別Keras模型
- AppUI 自動化中的影像識別的使用APPUI
- 面向推理訓練一體化的 MNN 工作臺
- PaddleOCR手寫文字識別模型訓練(摘抄所得,非原創)模型
- DeepPavlov:一個訓練對話系統和聊天機器人的開源庫機器人
- 4000萬蛋白結構訓練,西湖大學開發基於結構詞表的蛋白質通用大模型,已開源大模型
- 製作一個Node命令列影像識別工具命令列