經典 backbone 總結

嵌入式視覺發表於2023-01-04

VGG

VGG網路結構參數列如下圖所示。

VGG

ResNet

ResNet 模型比 VGG 網路具有更少的濾波器數量和更低的複雜性。比如 Resnet34 的 FLOPs 為 3.6G，僅為 VGG-19 19.6G 的 18%。

注意，論文中算的 FLOPs，把乘加當作 1 次計算。

ResNet 和 VGG 的網路結構連線對比圖，如下圖所示。

resnet

不同層數的 Resnet 網路參數列如下圖所示。

resnet網路參數列

看了後續的 ResNeXt、ResNetv2、Densenet、CSPNet、VOVNet 等論文，越發覺得 ResNet 真的算是 Backone 領域劃時代的工作了，因為它讓深層神經網路可以訓練，基本解決了深層神經網路訓練過程中的梯度消失問題，並給出了系統性的解決方案（兩種殘差結構），即系統性的讓網路變得更“深”了。而讓網路變得更“寬”的工作，至今也沒有一個公認的最佳方案（Inception、ResNeXt 等後續沒有廣泛應用），難道是因為網路變得“寬”不如“深”更重要，亦或是我們還沒有找到一個更有效的方案。

Inceptionv3

常見的一種 Inception Modules 結構如下：

Inception模組

Resnetv2

作者總結出恆等對映形式的快捷連線和預啟用對於訊號在網路中的順暢傳播至關重要的結論。

ResNeXt

ResNeXt 的卷積block 和 Resnet 對比圖如下所示。

resnext的卷積block和resnet的對比圖

ResNeXt 和 Resnet 的模型結構引數對比圖如下圖所示。

resnext的結構引數和resnet的對比圖

Darknet53

Darknet53 模型結構連線圖，如下圖所示。

darknet53

DenseNet

作者 Gao Huang 於 2018 年發表的論文 Densely Connected Convolutional Networks。

在密集塊（DenseBlock）結構中，每一層都會將前面所有層 concate 後作為輸入。DenseBlock（類似於殘差塊的密集塊結構）結構的 3 畫法圖如下所示：

3種DenseNet結構畫法

可以看出 DenseNet 論文更側重的是 DenseBlock 內各個卷積層之間的密集連線（dense connection）關係，另外兩個則是強調每層的輸入是前面所有層 feature map 的疊加，反映了 feature map 數量的變化。

CSPNet

CSPDenseNet 的一個階段是由區域性密集塊和區域性過渡層組成（a partial dense block and a partial transition layer）。

Figure3幾種不同形式的CSP

CSP 方法可以減少模型計算量和提高執行速度的同時，還不降低模型的精度，是一種更高效的網路設計方法，同時還能和 Resnet、Densenet、Darknet 等 backbone 結合在一起。

VoVNet

One-Shot Aggregation（只聚集一次）是指 OSA 模組的 concat 操作只進行一次，即只有最後一層(\(1\times 1\) 卷積)的輸入是前面所有層 feature map 的 concat（疊加）。OSA 模組的結構圖如圖 1(b) 所示。

VoVNet

在 OSA module 中，每一層產生兩種連線，一種是透過 conv 和下一層連線，產生 receptive field 更大的 feature map，另一種是和最後的輸出層相連，以聚合足夠好的特徵。透過使用 OSA module，5 層 43 channels 的 DenseNet-40 的 MAC 可以被減少 30%（3.7M -> 2.5M）。

基於 OSA 模組構建的各種 VoVNet 結構參數列如下。

各種VoVNet結構

作者認為 DenseNet 用更少的引數與 Flops 而效能卻比 ResNet 更好，主要是因為concat 比 add 能保留更多的資訊。但是，實際上 DenseNet 卻比 ResNet要慢且消耗更多資源。

GPU 的計算效率：

GPU 特性是擅長 parallel computation，tensor 越大，GPU 使用效率越高。
把大的卷積操作拆分成碎片的小操作將不利於 GPU 計算。
設計 layer 數量少的網路是更好的選擇。
1x1 卷積可以減少計算量，但不利於 GPU 計算。

在 CenterMask 論文提出了 VoVNetv2，其卷積模組結構圖如下：

VoVNetv2

一些結論

當卷積層的輸入輸出通道數相等時，記憶體訪問代價（MAC）最小。
影響 CNN 功耗的主要因素在於記憶體訪問代價 MAC，而不是計算量 FLOPs。
GPU 擅長平行計算，Tensor 越大，GPU 使用效率越高，把大的卷積操作拆分成碎片的小操作不利於 GPU 計算。
1x1 卷積可以減少計算量，但不利於 GPU 計算。

參考資料

VGG/ResNet/Inception/ResNeXt/CSPNet 論文
深度學習論文: An Energy and GPU-Computation Efficient Backbone Network for Object Detection及其PyTorch

文章經典總結
2020-10-31
CNN結構演變總結（一）經典模型
2021-02-27
CNN模型
Java經典常用類總結（必須掌握！）
2020-11-18
Java
《暗黑2》經典數值公式分析總結
2024-07-31
公式
前端經典的JavaScript面試知識總結
2019-03-01
前端JavaScript面試
經典機器學習演算法總結
2023-01-13
機器學習演算法
總結：iOS中多執行緒的經典崩潰
2020-06-22
iOS執行緒
視覺化經典模型的對比實驗總結
2022-03-05
視覺化模型
【演算法與資料結構】經典排序演算法總結
2018-10-03
演算法資料結構排序
連結串列經典示例
2020-12-15
Python網路程式設計（基礎總結入門經典）
2018-08-18
Python程式設計
【經典】連線oracle的總結（關於tnsname和監聽）
2020-04-07
Oracle
Java十大經典排序演算法最強總結
2019-01-05
Java排序演算法
總結！Python培訓之10道經典的面試題
2021-07-22
Python面試題
演算法型別大總結（並附經典題型）
2021-01-02
演算法型別
2萬字70道Java經典面試題總結(附答案)
2023-03-28
Java面試題
2萬字60道MySQL經典面試題總結(附答案)
2023-03-30
MySql面試題
49個Spring經典面試題總結，附帶答案，趕緊收藏
2019-04-18
Spring面試題
Vue經典開源專案彙總
2019-01-31
Vue
Spark 經典面試題彙總《一》
2023-02-27
Spark面試題
面經總結
2019-07-24
工作經驗總結
2020-11-13
Vue.js經典開源專案彙總
2019-03-20
Vue.js
經典Java面試題彙總及答案解析
2020-10-22
Java面試題
阿里歷年經典Java面試題彙總
2018-04-17
阿里Java面試題
Backbone前端框架解讀
2023-02-07
前端框架
十大經典排序演算法最強總結（含JAVA程式碼實現）
2020-08-13
排序演算法Java
做題經驗總結
2024-03-26
京東面經總結
2023-05-14
考試經驗總結
2024-10-23
SICP 經典
2024-03-25
【經典網路結構實現】LeNet-5
2020-10-10
高薪運維經典企業版面試題彙總
2018-11-27
高薪運維面試題
人工智慧研究：經典推理和非經典推理
2019-01-08
人工智慧
Android開發經驗總結
2019-03-21
Android
Git Flow 使用經驗總結
2019-01-07
Git
iOS開發經驗總結
2018-12-07
iOS
大佬有用的面經總結
2018-08-26

經典 backbone 總結

目錄

VGG

ResNet

Inceptionv3

Resnetv2

ResNeXt

Darknet53

DenseNet

CSPNet

VoVNet

一些結論

參考資料

相關文章