語義分割網路 U-Net 詳解

AIBigbull2050發表於2019-08-28

原文網址 : http://blog.itpub.net/69946223/viewspace-2655246/

Unet 背景介紹

Unet 發表於 2015 年，屬於 FCN 的一種變體，想了解 FCN 可以看我的另一篇 FCN 全卷積網路論文閱讀及程式碼實現。Unet 的初衷是為了解決生物醫學影像方面的問題，由於效果確實很好後來也被廣泛的應用在語義分割的各個方向，比如衛星影像分割，工業瑕疵檢測等。

Unet 跟 FCN 都是 Encoder-Decoder 結構，結構簡單但很有效。Encoder 負責特徵提取，你可以將自己熟悉的各種特徵提取網路放在這個位置。由於在醫學方面，樣本收集較為困難，作者為了解決這個問題，應用了影像增強的方法，在資料集有限的情況下獲得了不錯的精度。

Unet 網路結構與細節

Encoder

如上圖，Unet 網路結構是對稱的，形似英文字母 U 所以被稱為 Unet。整張圖都是由藍/白色框與各種顏色的箭頭組成，其中，藍/白色框表示 feature map；藍色箭頭表示 3x3 卷積，用於特徵提取；灰色箭頭表示 skip-connection，用於特徵融合；紅色箭頭表示池化 pooling，用於降低維度；綠色箭頭表示上取樣 upsample，用於恢復維度；青色箭頭表示 1x1 卷積，用於輸出結果。

可能你會問為啥是 5 層而不是 4 層或者 6 層，emmm，這應該去問作者本人，可能對於當時作者拿到的資料集來說，這個層數的表現更好，但不代表所有的資料集這個結構都適合。我們該多關注這種 Encoder-Decoder 的設計思想，具體實現則應該因資料集而異。

Encoder 由卷積操作和下采樣操作組成，文中所用的卷積結構統一為 3x3 的卷積核，padding 為 0 ，striding 為 1。沒有 padding 所以每次卷積之後 feature map 的 H 和 W 變小了，在 skip-connection 時要注意 feature map 的維度(其實也可以將 padding 設定為 1 避免維度不對應問題)，pytorch 程式碼：

nn.Sequential(nn.Conv2d(in_channels, out_channels, 3),

 nn.BatchNorm2d(out_channels),

 nn.ReLU(inplace=True))

上述的兩次卷積之後是一個 stride 為 2 的 max pooling，輸出大小變為 1/2 *(H, W)：

pytorch 程式碼：

nn.MaxPool2d(kernel_size=2, stride=2)

上面的步驟重複 5 次，最後一次沒有 max-pooling，直接將得到的 feature map 送入 Decoder。

Decoder

feature map 經過 Decoder 恢復原始解析度，該過程除了卷積比較關鍵的步驟就是 upsampling 與 skip-connection。

Upsampling 上取樣常用的方式有兩種：1. FCN 中介紹的反摺積；2. 插值。這裡介紹文中使用的插值方式。在插值實現方式中，bilinear 雙線性插值的綜合表現較好也較為常見。

雙線性插值的計算過程沒有需要學習的引數，實際就是套公式，這裡舉個例子方便大家理解(例子介紹的是引數 align_corners 為 Fasle 的情況)。

例子中是將一個 2x2 的矩陣通過插值的方式得到 4x4 的矩陣，那麼將 2x2 的矩陣稱為源矩陣，4x4 的矩陣稱為目標矩陣。雙線性插值中，目標點的值是由離他最近的 4 個點的值計算得到的，我們首先介紹如何找到目標點周圍的 4 個點，以 P2 為例。

第一個公式，目標矩陣到源矩陣的座標對映：

為了找到那 4 個點，首先要找到目標點在源矩陣中的相對位置，上面的公式就是用來算這個的。P2 在目標矩陣中的座標是 (0, 1)，對應到源矩陣中的座標就是 (-0.25, 0.25)。座標裡面居然有小數跟負數，不急我們一個一個來處理。我們知道雙線性插值是從座標周圍的 4 個點來計算該座標的值，(-0.25, 0.25) 這個點周圍的 4 個點是(-1, 0), (-1, 1), (0, 0), (0, 1)。為了找到負數座標點，我們將源矩陣擴充套件為下面的形式，中間紅色的部分為源矩陣。

我們規定 f(i, j) 表示 (i, j)座標點處的畫素值，對於計算出來的對應的座標，我們統一寫成 (i+u, j+v) 的形式。那麼這時 i=-1, u=0.75, j=0, v=0.25。把這 4 個點單獨畫出來，可以看到目標點 P2 對應到源矩陣中的相對位置。

第二個公式，也是最後一個。

f(i + u, j + v) = (1 - u) (1 - v) f(i, j) + (1 - u) v f(i, j + 1) + u (1 - v) f(i + 1, j) + u v f(i + 1, j + 1)

目標點的畫素值就是周圍 4 個點畫素值的加權和，明顯可以看出離得近的權值比較大例如 (0, 0) 點的權值就是 0.75*0.75，離得遠的如 (-1, 1) 權值就比較小，為 0.25*0.25，這也比較符合常理吧。把值帶入計算就可以得到 P2 點的值了，結果是 12.5 與程式碼吻合上了，nice。

pytorch 裡使用 bilinear 插值：

nn.Upsample(scale_factor=2, mode='bilinear')

CNN 網路要想獲得好效果，skip-connection 基本必不可少。Unet 中這一關鍵步驟融合了底層資訊的位置資訊與深層特徵的語義資訊，pytorch 程式碼：

torch.cat([low_layer_features, deep_layer_features], dim=1)

這裡需要注意的是，FCN 中深層資訊與淺層資訊融合是通過對應畫素相加的方式，而 Unet 是通過拼接的方式。

那麼這兩者有什麼區別呢，其實在 ResNet 與 DenseNet 中也有一樣的區別，Resnet 使用了對應值相加，DenseNet 使用了拼接。個人理解在相加的方式下，feature map 的維度沒有變化，但每個維度都包含了更多特徵，對於普通的分類任務這種不需要從 feature map 復原到原始解析度的任務來說，這是一個高效的選擇；而拼接則保留了更多的維度/位置資訊，這使得後面的 layer 可以在淺層特徵與深層特徵自由選擇，這對語義分割任務來說更有優勢。

小結

Unet 基於 Encoder-Decoder 結構，通過拼接的方式實現特徵融合，結構簡明且穩定，如果你有語義分割的問題，尤其在樣本資料量不大的情況下，十分推薦一試。

https://www.toutiao.com/a6729482984648344068/

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/69946223/viewspace-2655246/，如需轉載，請註明出處，否則將追究法律責任。

使用全卷積神經網路FCN，進行影像語義分割詳解(附帶Tensorflow詳解程式碼實現)
2020-07-24
卷積神經網路
[譯]使用 U-Net 進行語義分割（第一部分）
2019-03-04
語義分割丨PSPNet原始碼解析「網路訓練」
2019-05-28
原始碼
語義網路術語
2018-10-14
全卷積網路（FCN）實戰：使用FCN實現語義分割
2022-03-18
卷積
ETH Zurich提出新型網路「ROAD-Net」，解決語義分割域適配問題
2018-05-03
曠視科技提出雙向網路BiSeNet：實現實時語義分割
2018-09-04
SENet
自動網路搜尋（NAS）在語義分割上的應用（二）
2020-05-26
33-全連線神經網路FCN（語義分割的奠基工作）
2024-09-10
神經網路
31-語義分割
2024-08-29
語言分割偽彩色掩碼詳解
2024-05-25
常用語義分割資料集
2021-01-03
一塊GPU就能訓練語義分割網路，百度PaddlePaddle是如何優化的？
2019-01-31
GPU優化
「網路安全術語解讀」通用平臺列舉CPE詳解
2024-05-05
語義分割的標準度量MIoU
2020-10-28
Pixellib語義分割-影像背景替換
2024-06-22
linux網路模式詳解
2024-03-31
Linux模式
基於深度學習的影象語義分割技術概述之背景與深度網路架構
2019-01-25
深度學習架構
詳解計算機視覺五大技術：影象分類、物件檢測、目標跟蹤、語義分割和例項分割
2019-07-24
計算機視覺物件
詳解計算機視覺五大技術：影像分類、物件檢測、目標跟蹤、語義分割和例項分割...
2018-04-19
計算機視覺物件
BSN-DDC基礎網路詳解（八）：部署自定義智慧合約
2023-04-14
Docker的網路模式詳解
2019-01-07
Docker模式
網路命令ifconfig用法詳解。
2024-02-06
網路安全——防火牆詳解
2023-03-07
防火牆
詳解 Docker 容器網路配置
2022-10-11
Docker
影像分割中的深度學習：U-Net 體系結構
2019-10-07
深度學習
三維點雲語義分割模型介紹
2018-11-18
模型
影像語義分割資料增強——imgaug（二）
2020-11-02
Hive動態分割槽詳解
2020-12-23
Hive
網路要素服務（WFS）詳解
2024-01-21
LeNet-5網路搭建詳解
2021-06-20
網路安全Bypass網路卡詳細講解
2021-12-27
【Linux】(小白向)詳解VirtualBox網路配置-配置Linux網路
2023-05-18
Linux
新型實時形義分割網路ShuffleSeg：可用於嵌入式裝置
2018-03-21
詳解ResNet 網路，如何讓網路變得更“深”了
2023-03-17
caffe網路各層引數詳解
2018-10-16
NFS網路檔案系統詳解
2018-09-07
NFS
iOS網路層詳解和優化
2018-03-15
iOS優化

語義分割網路 U-Net 詳解

Unet 背景介紹

Unet 網路結構與細節

相關文章