直接理解轉置卷積（Transposed convolution）的各種情況

頎周發表於2020-10-29

原文網址 : https://www.cnblogs.com/qizhou/p/13895967.html

　　使用GAN生成影像必不可少的層就是上取樣，其中最常用的就是轉置卷積（Transposed Convolution）。如果把卷積操作轉換為矩陣乘法的形式，轉置卷積實際上就是將其中的矩陣進行轉置，從而產生逆向的效果。所謂效果僅僅在於特徵圖的形狀，也就是說，如果卷積將特徵圖從形狀a對映到形狀b，其對應的轉置卷積就是從形狀b對映回形狀a，而其中的值並不一一對應，是不可逆的。另外，不要把逆卷積（Deconvolution）和轉置卷積混淆，逆卷積的目標在於構建輸入特徵圖的稀疏編碼（Sparse coding），並不是以上取樣為目的的。但是轉置卷積的確是來源於逆卷積，關於逆卷積與轉置卷積的論文請看[1][2]。

　　下面直接對轉置卷積的各種情況進行舉例，從而全面理解轉置卷積在Pytorch中的運算機制。使用Pytorch而不是TF的原因在於，TF中的padding方式只有兩種，即valid與same，並不能很好地幫我們理解原理。而且TF和Pytorch插入0值的方式有些差異，雖然在模型層面，你只需關注模型輸入輸出的形狀，隱層的微小差異可以通過訓練來抵消，但是為了更好得把握模型結構，最好還是使用Pytorch。

　　對於Pytorch的nn.ConvTranspose2d()的引數，下面的討論不考慮膨脹度dilation，預設為1；output_padding就是在最終的輸出特徵外面再加上幾層0，所以也不討論，預設為0；為了便於理解，bias也忽略不計，設為False；不失一般性，輸入輸出的channels都設為1。除了對將卷積轉換成矩陣乘法的理解外，理解難點主要在於stride和padding的變化對轉置卷積產生的影響，因此下面我們主要變化kernel_size、stride、padding三個引數來分析各種情況。

　　舉例之前要注意，轉換為矩陣的形式是由卷積的結果得到的，矩陣形式本身是不能直接獲得的。要注意這個因果關係，轉換為矩陣形式是為了便於理解，以及推導轉置卷積。

例項分析

kernel_size = 2, stride = 1, padding = 0

　　首先是kernel_size = 2，stride=1，padding=0的情況，如下圖：

　　圖中上半部分表示將卷積轉換為矩陣乘法的形式。在卷積中，我們是輸入一個3x3的特徵圖，輸出2x2的特徵圖，矩陣乘法形式如上圖上中部分所示；轉置卷積就是將這個矩陣乘法反過來，如上圖下中部分所示。然後將下中部分的矩陣乘法轉換為卷積的形式，即可得到轉置卷積的示意圖如上圖右下部分所示。

kernel_size = 2, stride = 1, padding = 1

　　然後是kernel_size = 2，stride=1，padding=1的情況（因為第一張圖中已有，虛線與註釋都不加了）：

　　與上一張圖的主要不同之處在於轉置卷積將卷積結果的最外層去掉，這是因為padding=1，也正符合與卷積相反的操作。也就是說，padding越大，轉置卷積就會去掉越多的外層，輸出就會越小。

kernel_size = 3, stride = 1, padding = 1

　　為了分析轉置卷積的卷積核與卷積的卷積核的區別，這次把kernel_size變為3，如下圖：

　　可以看出，轉置卷積的先將輸入padding 2層，用於抵消卷積核帶來的規模上的減小，從而將輸出擴增到相對應卷積操作的輸入大小。然後，我們可以發現，卷積核是輸入的卷積核的逆序。也就是說，我們輸入函式中的是1~9的方陣，而它實際作為卷積核的是9~1的方陣。最後，因為padding=1，這對於卷積操作是向外加一層0，而對於逆卷積，就是去掉最外面的一層，所以得到最終3x3的結果。

kernel_size = 2, stride = 2, padding = 1

　　最後，分析stride對轉置卷積的影響，將stride設為2，如下圖：

　　分析在圖中都已寫明。你可能會奇怪，為什麼這裡轉置卷積最終輸出與卷積的輸入形狀不同，這是因為卷積的padding並沒有被全都用上（只計算了一邊），而轉置卷積最後卻把兩邊的padding都去掉了，所以造成了卷積與轉置卷積不對應的情況。

總結

　　經過對以上各種例項的分析，對於某個$kernel \,size=k,stride=s,padding=p$的轉置卷積，如果輸入寬高都為$n$，則輸出寬高為

$\begin{aligned} m&=ns-(s-1)+2(k-1)-(k-1)-2p\\ &=(n-1)s-2p+k \\ \end{aligned}$

　　實際上，卷積與轉置卷積除了輸入輸出的形狀上相反以外，沒有別的聯絡，所以我們只要會計算轉置卷積輸出的形狀即可。

　　以上圖都是用excel作的，已上傳至部落格園檔案，需要的可以下載（點選連結）。

參考文獻

　　[1] Zeiler M D, Krishnan D, Taylor G W, et al. Deconvolutional networks[C]. Computer Vision and Pattern Recognition, 2010.

　　[2] Zeiler M D, Fergus R. Visualizing and Understanding Convolutional Networks[C]. European Conference on Computer Vision, 2013.

空洞卷積 Dilated Convolution
2024-04-08
卷積
Tied Block Convolution：一種共享filter的卷積形態
2020-11-17
BloCFilter卷積
傅立葉變換（二）—— 卷積 Convolution
2020-10-19
卷積
變數轉化為判斷條件時的各種情況
2019-06-13
變數
vue日記②之相容各種情況的可跳轉連結
2021-08-10
Vue
產生直接路徑讀的N種情況
2024-02-10
MYSQL索引失效的各種情況小結
2021-06-04
MySql索引
由淺入深：CNN中卷積層與轉置卷積層的關係
2018-11-22
CNN卷積
卷積漲點論文 | Asymmetric Convolution ACNet | ICCV | 2019
2020-12-22
卷積
卷積神經網路四種卷積型別
2018-12-17
卷積神經網路型別
【CNN】很詳細的講解什麼以及為什麼是卷積（Convolution）！
2020-04-06
CNN卷積
一文帶你瞭解深度學習中的各種卷積（上）
2019-02-22
深度學習卷積
一文帶你瞭解深度學習中的各種卷積（下）
2019-02-28
深度學習卷積
RabbitMQ如何解決各種情況下丟資料的問題
2020-11-01
MQ
NoClassDefFoundError的兩種情況
2023-01-12
Error
用 Pytorch 理解卷積網路
2020-04-06
PyTorch卷積
三種“榨乾”企業裝置服裝ERP預算的情況
2022-07-16
資料庫事務併發問題----各種事務隔離下的情況
2020-12-15
資料庫
使用聯合索引的一種情況
2020-06-26
索引
if 判斷為 false 的 6 種情況
2020-07-06
False
[Python] 各種轉換
2018-08-27
Python
深入理解 Android 中的各種 Context
2018-12-23
AndroidContext
影像處理中的valid卷積與same卷積
2020-06-20
卷積
synchronized Lock（本地同步）鎖的8種情況
2021-09-23
synchronized
文科生如何理解卷積神經網路？
2018-06-27
卷積神經網路
帶你換個角度理解圖卷積網路
2021-07-15
卷積
卷積神經網路數學原理解析
2022-09-16
卷積神經網路
這三種情況，ToDesk個人版有必要轉企業版
2024-07-13
多種情況解析深複製
2020-11-16
js中this指向有幾種情況
2021-09-11
JS
卷積神經網路中感受野的理解和計算
2020-11-03
卷積神經網路
5.2.1.1 卷積
2019-12-31
卷積
卷積核
2024-10-04
卷積
JS獲取元素寬高的兩種情況
2018-07-16
JS
SRAM的基礎模組存有三種情況
2020-09-02
js中bool值為false的幾種情況
2019-07-16
JSFalse
各個大廠裁員情況，已經慌的一B
2018-12-14
玩轉陣列各種方法
2018-08-01
陣列