卷積層和全連線層之間的關係

MoSalah發表於2021-11-13

原文網址 : https://www.cnblogs.com/tangzj/p/15550355.html

卷積

1 卷積層和全連線層的概念

https://towardsdatascience.com/convolutional-neural-network-17fb77e76c05

2 卷積層和全連線層間關係

2.1 1 × 1卷積核的卷積層和全連線層

假設有一個三維圖片輸入，大小為 3 × 3 × 3, 其中 3 為 channel 顏色維度，3 × 3 長和寬畫素維度。下面分別通過卷積層和全連線層進行計算。

2.1.1 通過卷積層計算圖片

下面通過一個卷積層計算，其中卷積層中卷積核為 3 × 1 × 1，擴充為0，步長為 1，輸入通道為 3，輸出通道為2。

顯然，Kernel中有 6 個引數，這是我們需要資料迭代去訓練的引數。

2.1.2 通過全連線層計算圖片

我們根據輸入影像和輸出影像，建立一個全連線層：

首先將圖片資料轉化為一維向量，向量長為 3³，該向量作為輸入層。同樣轉化卷積層結果（ 2 × 3 × 3 張量）為長度 18 的一維向量，作為輸出層。

通過計算可以知道，此全連線層的引數數量為 486 個（ 27 * 18 ）。

很明顯全連線層的引數遠遠比卷積層的核函式中的引數多很多，下面我們將根據卷積層的計算原理逐步搭建一個全連線層，以此來搞清楚全連線層引數數量高的原因。

首先，根據卷積層計算原理，可知：

　　　　Y₀₀₀ = X₀₀₀* K₀₀₀₀+ X₁₀₀* K₀₁₀₀+ X₂₀₀* K₀₂₀₀

根據此式可構建全連線層：

同理，構建輸出層中 channel = 0 的關係。

　　　　Y[0] = X[0] * K[0] + X[1] * K[0] + X[2] * K[0] + X[3] * K[0] + X[4] * K[0] + X[5] * K[0] + X[6] * K[0] + X[7] * K[0] + X[8] * K[0]

可以看出全連線層的引數數量是之前的 9 倍，但是僅僅是 K[0] 的三個引數複製使用而已。（這也是卷積層的特點之一，權值共享）

相同顏色的引數代表權重相同。

然後，對輸出層上的剩餘的 channel 做同樣的計算。

　　　　Y[1] = X[0] * K[1] + X[1] * K[1] + X[2] * K[1] + X[3] * K[1] + X[4] * K[1] + X[5] * K[1] + X[6] * K[1] + X[7] * K[1] + X[8] * K[1]

可以發現計算涉及的引數，只有 K[1] 改變了，這是由卷積層計算的原理有關，由卷積核的輸出通道數量決定輸出的維度，在全連線層中，表現為輸出層的大小。

顯然，因為改變了卷積核的引數，全連線層的引數也應當改變，所以完整的全連線層如下，構建完成。

相同顏色的引數代表在同一個卷積核的同一個維度，一共有 54 個引數。

2.1.3 對比與總結

根據卷積層計算構建的全連線層實質等效於卷積層，因此，卷積層所做的計算次數（乘法）相等於全連線層的引數數量（54個，2組引數，每組3個引數重複使用9次），卷積核的引數數量（6個）相等於全連線層的有效引數（不為0的引數）數量（2組，每組3個引數）。而此全連線層的引數（54個）相較於不考慮計算的全連線層的引數（486個）同樣少很多，那麼可以將剩下沒有在卷積層計算中體現出來的引數均視為0，這樣就滿足了全連線層應有的引數數量。

2.2 輸入資料的spatial維度和卷積核相同的卷積層和全連線層

假設有一個三維圖片輸入，大小為 3 × 3 × 3, 其中 3 為 channel 顏色維度，3 × 3 長和寬畫素維度。下面分別通過卷積層和全連線層進行計算。

2.1.1 通過卷積層計算圖片

下面通過一個卷積層計算，其中卷積層中卷積核為 3 × 3 × 3，擴充為0，步長為 1，輸入通道為 3，輸出通道為2。

顯然，Kernel中有 54 個引數，這是我們需要資料迭代去訓練的引數。

2.1.2 通過全連線層計算圖片

我們根據輸入影像和輸出影像，建立一個全連線層：

首先將圖片資料轉化為一維向量，向量長為 3³，該向量作為輸入層。同樣轉化卷積層結果（ 2 × 1 張量）為長度 2 的一維向量，作為輸出層。

觀察得知，可以發現此全連線層引數於卷積核的引數相同。此外，該全連線層的計算和卷積層的計算也是相同的。

因此，可以說此全連線層等效於卷積層。

2.1.3 對比與總結

可以看出，如果卷積核和輸入資料的spatial維度相同時，卷積層等價於全連線層。

2.3 n₁ × n₂ 卷積核的卷積層和全連線層

假設有一個三維圖片輸入，大小為 channel1 × h × w, 其中 channel 為顏色維度，h × w 長和寬畫素維度。通過一個核函式為 channel2 × channel1 × n₁ × n₂ 的卷積層，那麼會輸出大小為 channel2 × r₁ × r₂ 的張量，其中 r₁ = ⌊(h - n₁)/s⌋ + 1，r₂ = ⌊(h - n₂)/s⌋ + 1。

其中，最終輸出的張量，包含 channel2 * r₁ * r₂ 個項，其中每一項都是通過 channel1 次卷積運算後相求和得到的，每一次卷積運算會涉及 n₁ * n₂ 次乘法運算，所以一共會涉及 channel1 * channel2 * n₁* n₂* r₁ * r₂ 次計算。

如果將該卷積層轉換為全連線層，因為輸入層是大小為 channel1 × h × w 的向量，輸出大小為 channel2 × r₁ × r₂的向量，全連線層就會有 channel1 * channel2 * h * w * r₁ * r₂個引數，其中大部分均為0，channel1 * channel2 * n₁* n₂* r₁ * r₂個為存在值的有效引數，有效引數是由 channel1 * channel2 * n₁* n₂ 個引數重複 r₁* r₂ 次組成的。

經過 r₁* r₂ 次重複的核心有效引數即使卷積層的卷積核內的引數。

3 總結

下面做個簡單的歸納，對比全連線層的全引數數量和有效引數數量，可以發現：

當 h * w == n₁* n₂且 n₁≤ h && n₂ ≤ w 時，即 h == n₁ && w == n₂ 時，全連線層即可完全等價於卷積層，並且 r₁ == r₂ == 1，不會存在重複的有效引數。
當 n₁< h || n₂ < w 時，n₁ 和 n₂ 的值分別越接近 h 和 w，那麼全連線層的有效引數率越高。
當 r₁ > 1 || r₂> 1 時，r₁和 r₂的值越大，有效引數的重複率越高。

由淺入深：CNN中卷積層與轉置卷積層的關係
2018-11-22
CNN卷積
5.2.1.3 卷積層
2019-12-31
卷積
聊聊池化層和步長為2的卷積層
2023-03-22
卷積
全連線層的作用解析
2020-12-17
神經網路之卷積篇：詳解單層卷積網路（One layer of a convolutional network）
2024-08-20
神經網路卷積
[PyTorch 學習筆記] 3.2 卷積層
2020-08-30
PyTorch筆記卷積
何為神經網路卷積層？
2023-03-16
神經網路卷積
python三層全連線層實現手寫字母識別方式
2021-01-25
Python
JAVA類的頂層Type抽象和繼承關係
2020-10-07
Java抽象繼承
卷積神經網路的一些細節思考（卷積、池化層的作用）
2018-10-20
卷積神經網路
神經網路基礎部件-卷積層詳解
2023-02-16
神經網路卷積
Window, WindowManager和WindowManagerService之間的關係
2019-07-20
將圖卷積應用於關係推理
2020-11-08
卷積
卷積核大小選擇、網路層數問題
2024-05-02
卷積
用 Excel 來闡釋什麼是多層卷積
2019-08-22
Excel卷積
吳恩達深度學習：單層卷積網路
2020-11-15
吳恩達深度學習卷積
Java中各程式碼層級的關係
2024-08-23
Java
[譯] 淺析深度學習神經網路的卷積層
2019-05-29
深度學習神經網路卷積
Vue 高德地圖 API Loca 如何使用連線線圖層、脈衝連線圖層
2022-03-25
Vue地圖API
【python實現卷積神經網路】卷積層Conv2D反向傳播過程
2020-04-16
Python卷積神經網路反向傳播
神經網路前向和後向傳播推導（二）：全連線層
2022-06-07
神經網路
Kubernetes和Docker之間的關係是什麼？
2020-09-04
Docker
網站和伺服器之間的關係
2022-09-30
網站伺服器
Web3和元宇宙之間的關係
2022-05-31
Web元宇宙
【java】類之間的關係
2020-11-30
Java
深度學習之輸入通道個數、卷積核通道個數，卷積核個數、輸出通道個數的關係
2020-10-13
深度學習卷積
1. 從多層感知機到卷積神經網路
2019-02-13
卷積神經網路
Go HTTP 重用底層 TCP 連線需要注意的關鍵點
2020-06-29
GoHTTPTCP
備份集和備份片之間的關係
2022-03-18
深度學習2.0-12.神經網路與全連線層之資料集的載入
2020-10-08
深度學習神經網路
前端之DOM解析和渲染與CSS、JS之間的關係
2019-01-02
前端CSSJS
Window、WindowManager、View 之間的關係
2019-03-06
View
git、github、gitlab之間的關係
2018-08-09
GithubGitlab
TPS和響應時間之間是什麼關係
2021-06-07
簡單的RNN和BP多層網路之間的區別
2018-11-10
RNN
底層剖析 Window 、Activity、 View 三者關係
2020-07-07
View
計算機網路基礎-三種網路模型（OSI七層模型 TPC/IP四層模型五層模型）的關係
2020-10-05
計算機網路模型
【單頁應用】我們該如何處理框架彈出層層級關係？
2021-09-09
框架

卷積層和全連線層之間的關係

1 卷積層和全連線層的概念

2 卷積層和全連線層間關係

2.1 1 × 1卷積核的卷積層和全連線層

2.1.1 通過卷積層計算圖片

2.1.2 通過全連線層計算圖片

2.1.3 對比與總結

2.2 輸入資料的spatial維度和卷積核相同的卷積層和全連線層

2.1.1 通過卷積層計算圖片

2.1.2 通過全連線層計算圖片

2.1.3 對比與總結

2.3 n1 × n2 卷積核的卷積層和全連線層

3 總結

相關文章

2.3 n₁ × n₂ 卷積核的卷積層和全連線層