EfficientNet模型的完整細節

AIBigbull2050發表於2020-09-23

原文網址 : http://blog.itpub.net/69946223/viewspace-2723254/

2020-09-14 09:12:40

作者：Vardan Agarwal

編譯：ronghuaiyang

導讀

深入研究所有不同EfficientNet結構的細節。

我在一個Kaggle競賽中翻閱notebooks，發現幾乎每個人都在使用EfficientNet 作為他們的主幹，而我之前從未聽說過這個。谷歌AI在這篇文章中：https://arxiv.org/abs/1905.11946介紹了它，他們試圖提出一種更高效的方法，就像它的名字所建議的那樣，同時改善了最新的結果。一般來說，模型設計得太寬，太深，或者解析度太高。剛開始的時候，增加這些特性是有用的，但很快就會飽和，然後模型的引數會很多，因而效率不高。在EfficientNet中，這些特性是按更有原則的方式擴充套件的，也就是說，一切都是逐漸增加的。

EfficientNet模型的完整細節

不明白髮生了什麼？不要擔心，一旦看到了架構，你就會明白了。但首先，讓我們看看他們得到了什麼結果。

EfficientNet模型的完整細節

由於引數的數目相當少，這個模型族是非常高效的，也提供更好的結果。現在我們知道了為什麼這些可能會成為標準的預訓練模型，但是缺少了一些東西。

共同之處

首先，任何網路都以它為主幹，在此之後，所有對架構的實驗都以它為開始，這在所有8個模型和最後的層中都是一樣的。

EfficientNet模型的完整細節

之後，每個主幹包含7個block。這些block還有不同數量的子block，這些子block的數量隨著EfficientNetB0到EfficientNetB7而增加。要視覺化模型層，程式碼如下：


!pip 
install tf-nightly-gpu

import tensorflow 
as tf

IMG_SHAPE = (
224, 
224, 
3)

model0 = tf.keras.applications.EfficientNetB0(input_shape=IMG_SHAPE, include_top=
False, weights=
"imagenet")

tf.keras.utils.plot_model(model0) 
# to draw and visualize


model0.summary() # to see the list of layers and parameters

如果你計算EfficientNet-B0的總層數，總數是237層，而EfficientNet-B7的總數是813層！！但不用擔心，所有這些層都可以由下面的5個模組和上面的主幹組成。

EfficientNet模型的完整細節

我們使用這5個模組來構建整個結構。

模組1 — 這是子block的起點。
模組2 — 此模組用於除第一個模組外的所有7個主要模組的第一個子block的起點。
模組3 — 它作為跳躍連線到所有的子block。
模組4 — 用於將跳躍連線合併到第一個子block中。
模組5 — 每個子block都以跳躍連線的方式連線到之前的子block，並使用此模組進行組合。

這些模組被進一步組合成子block，這些子block將在block中以某種方式使用。

EfficientNet模型的完整細節

子block1 — 它僅用於第一個block中的第一個子block。
子block2 — 它用作所有其他block中的第一個子block。
子block3 — 用於所有block中除第一個外的任何子block。

到目前為止，我們已經指定了要組合起來建立EfficientNet模型的所有內容，所以讓我們開始吧。

EfficientNet-B0

EfficientNet模型的完整細節

EfficientNet-B0架構。(x2表示括號內的模組重複兩次)

EfficientNet-B1

EfficientNet模型的完整細節

EfficientNet-B1的結構

EfficientNet-B2

它的架構與上面的模型相同，唯一的區別是特徵圖(通道)的數量不同，增加了引數的數量。

EfficientNet-B3

EfficientNet模型的完整細節

EfficientNet-B3的結構

EfficientNet-B4

EfficientNet模型的完整細節

EfficientNet-B4的結構

EfficientNet-B5

EfficientNet模型的完整細節

EfficientNet-B5的結構

EfficientNet-B6

EfficientNet模型的完整細節

EfficientNet-B6的結構

EfficientNet-B7

EfficientNet模型的完整細節

EfficientNet-B7的結構

很容易看出各個模型之間的差異，他們逐漸增加了子block的數量。如果你理解了體系結構，我鼓勵你將任意的模型列印出來，並仔細閱讀它以更徹底地瞭解它。下面的表表示了EfficientNet-B0中卷積操作的核心大小以及解析度、通道和層。

EfficientNet模型的完整細節

此表已包含在原始論文中。對於整個模型族來說，解析度是一樣的。我不確定卷積核的大小是否改變了。層的數量已經在上面的圖中顯示了。通道數量是不同的，它是根據從每個型號的摘要中看到的資訊計算出來的，如下所示：

EfficientNet模型的完整細節

在結束之前，我附上了另一個影像，來自它的研究論文，顯示了它與其他的SO他的performance的比較，還有減少的引數的數量和所需的FLOPS。

EfficientNet模型的完整細節

英文原文：https://towardsdatascience.com/complete-architectural-details-of-all-efficientnet-models-5fd5b736142

https://blog.csdn.net/weixin_42137700/article/details/108735114

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/69946223/viewspace-2723254/，如需轉載，請註明出處，否則將追究法律責任。

相關文章

EfficientNet 簡介
2021-12-23
Go 開發時要了解的 1 個記憶體模型細節
2021-10-28
Go記憶體模型
openstack完整的部署（最詳細）
2024-05-04
探索 YOLO v3 實現細節 - 第2篇模型
2018-08-03
YOLO模型
探索 YOLO v3 實現細節 – 第2篇模型
2019-03-04
YOLO模型
慢慢細談Android 面試的細節
2019-01-28
Android面試
阿里雲通義大模型新技術：MoE模型訓練專家平衡的關鍵細節
2025-01-24
阿里大模型
小細節
2024-06-25
EfficientNet & EfficientDet 論文解讀
2021-04-03
速度與精度的結合 - EfficientNet 詳解
2019-10-12
EfficientNet-resDDSC：一種整合殘差塊和擴充套件卷積的混合深度學習模型推斷單細胞資料中的基因因果關係
2024-12-01
套件卷積深度學習模型
[JAVA] Java switch的使用細節
2020-03-21
Java
Docker映象細節
2019-01-29
Docker
理理Vue細節
2019-04-15
Vue
細節總結
2018-08-16
MyBatis摳細節
2020-10-14
MyBatis
OpenFeign 使用細節
2024-09-05
Wise 打包細節
2018-04-21
機器級程式的小細節
2018-11-05
關於輸入框的細節
2018-04-30
Laravel 的一個命名細節分享
2020-01-10
Laravel
for 迴圈的一些細節
2020-07-16
Docker 19.03.13的四個使用細節
2020-11-20
Docker
vue元件使用的細節 is 屬性
2020-10-25
Vue元件
Termux使用的一些細節
2024-10-22
UX
一個小的技術細節
2021-12-15
從細節理解鎖的升級
2021-09-05
TCP 中的兩個細節點
2021-05-25
TCP
Python入門細節
2019-02-16
Python
DialogFragment細枝末節
2019-03-10
Fragment
Python進階細節
2019-02-16
Python
Vue、Javascript小細節
2018-08-11
VueJavaScript
Laravel核心——服務容器的細節特性
2019-02-16
Laravel
Linux Shell的訊號trap功能細節
2018-09-22
Linux
CSS細節的威力2018-08-31
2018-08-31
CSS
重溫Java Web的技術細節
2020-08-31
JavaWeb
看FCOS時的小細節總結
2020-10-14
可能被忽略的"按鈕元件"細節
2019-01-30
元件