Dilated Convolutions 空洞卷積

-牧野-發表於2018-07-20

Dilated Convolutions,中文一般稱為空洞卷積或者擴張卷積,是一種改進的影象卷積方法。
擴張卷積工作示意圖如下:

圖a是普通的卷積,感受野是3*3,相當於不擴充,dilation=1
圖b是擴張卷積,感受野是7*7,dilation=2
圖c是擴張卷積,感受野是15*15,dilation=4
 
擴張卷積中多了一個擴充率引數(dilation rate),用來控制擴張(空洞填充)的大小,擴充率引數越大,同等卷積核大小對應的感受野越大。擴充卷積對普通卷積的改進就是為了獲得更大的感受野。
 
標準卷積在特定場景如影象語義分割下存在一定的問題,比如通過池化操作降低計算量,同時增大感受野,再通過反摺積(上取樣)擴充影象到原始大小,這中間會丟失很多資訊,特別是空間結構資訊,另一個問題是小的物體資訊無法復原重建出來。而在空洞卷積中,避免了使用池化操作的同時增大了感受野,不需要影象解析度的壓縮,保留了影象內部的資料結構,可以有比標準卷積更好的分割效果。

 

參考資料https://arxiv.org/abs/1511.07122

相關文章