CVPR 2019 | PoolNet：基於池化技術的顯著性目標檢測

PaperWeekly發表於2019-05-27

原文網址 : http://www.jiqizhixin.com/articles/2019-05-27-12

研究動機

這是一篇發表於 CVPR 2019 的關於顯著性目標檢測的 paper，在 U 型結構的特徵網路中，高層富含語義特徵捕獲的位置資訊在自底向上的傳播過程中可能會逐漸被稀釋，另外卷積神經網路的感受野大小與深度是不成正比的。

目前很多流行方法都是引入 Attention（注意力機制），但是本文是基於 U 型結構的特徵網路研究池化對顯著性檢測的改進，具體步驟是引入了兩個模組GGM (Global Guidance Module，全域性引導模組) 和 FAM (Feature Aggregation Module，特徵整合模組)，進而銳化顯著物體細節，並且檢測速度能夠達到 30FPS。因為這兩個模組都是基於池化做的改進所以作者稱其為PoolNet，並且放出了原始碼：

https://github.com/backseason/PoolNet

模型架構

CVPR 2019 | PoolNet：基於池化技術的顯著性目標檢測

兩個模組

GGM（全域性引導模組）

我們知道高層語義特徵對挖掘顯著物件的詳細位置是很有幫助的，但是中低層的語義特徵也可以提供必要的細節。因為在 top-down 的過程中，高層語義資訊被稀釋，而且實際上的感受野也是小於理論感受野，所以對於全域性資訊的捕捉十分的缺乏，導致顯著物體被背景吞噬。

因此作者提出了 GGM 模組，GGM 其實是 PPM（Pyramid Pooling module，金字塔池化模組）的改進並且加上了一系列的 GGFs（Global Guiding Flows，全域性引導流），這樣做的好處是，在特徵圖上的每層都能關注到顯著物體，另外不同的是，GGM 是一個獨立的模組，而 PPM 是在 U 型架構中，在基礎網路（backbone）中參與引導全域性資訊的過程。

其實這部分論文說得並不是很清晰，沒有說 GGM 的詳細結構，我們可以知道 PPM [7] 的結構如下：

CVPR 2019 | PoolNet：基於池化技術的顯著性目標檢測

該 PPM 模組融合了 4 種不同金字塔尺度的特徵，第一行紅色是最粗糙的特徵–全域性池化生成單個 bin 輸出，後面三行是不同尺度的池化特徵。為了保證全域性特徵的權重，如果金字塔共有 N 個級別，則在每個級別後使用 1×1 的卷積將對於級別通道降為原本的 1/N。再通過雙線性插值獲得未池化前的大小，最終 concat 到一起。

如果明白了這個的話，其實 GGM 就是在 PPM 的結構上的改進，PPM 是對每個特徵圖都進行了金字塔池化，所以作者說是嵌入在 U 型結構中的，但是他加入了 global guiding flows（GGFs），即 Fig1 中綠色箭頭，引入了對每級特徵的不同程度的上取樣對映（文中稱之為 identity mapping），所以可以是個獨立的模組。

簡單地說，作者想要 FPN 在 top-down 的路徑上不被稀釋語義特徵，所以在每次橫向連線的時候都加入高層的語義資訊，這樣做也是一個十分直接主觀的想法。

FAM（特徵整合模組）

特徵整合模組也是使用了池化技巧的模組，如下圖，先把 GGM 得到的高層語義與該級特徵分別上取樣之後橫向連線一番得到 FAM 的輸入 b，之後採取的操作是先把 b 用 {2,4,8} 的三種下取樣得到藍綠紅特徵圖然後 avg pool（平均池化）再上取樣回原來尺寸，最後藍綠紅紫（紫色是 FAM 的輸入 b）四個分支畫素相加得到整合後的特徵圖。

CVPR 2019 | PoolNet：基於池化技術的顯著性目標檢測

FAM 有以下兩個優點：

1. 幫助模型降低上取樣（upsample）導致的混疊效應（aliasing）；

2. 從不同的多角度的尺度上縱觀顯著物體的空間位置，放大整個網路的感受野。

第二點很容易理解，從不同角度看，不同的放縮尺度看待特徵，能夠放大網路的感受野。對於第一點降低混疊效應的理解，用明珊師姐說的話，混疊效應就相當於引入雜質，GGFs 從基礎網路最後得到的特徵圖經過金字塔池化之後需要最高是 8 倍上取樣才能與前面的特徵圖融合，這樣高倍數的取樣確實容易引入雜質。

作者就是因為這樣才會提出 FAM，進行特徵整合，先把特徵用不同倍數的下采樣，池化之後，再用不同倍數的上取樣，最後疊加在一起。因為單個高倍數上取樣容易導致失真，所以補救措施就是高倍數上取樣之後，再下采樣，再池化上取樣平均下來可以彌補錯誤。

CVPR 2019 | PoolNet：基於池化技術的顯著性目標檢測

上圖就是為了說明 FAM 的優點的，經過高倍上取樣之後的影象（b）和（d）容易引入許多雜質，致使邊緣不清晰，但是經過 FAM 模組之後的特徵圖就能降低混疊效應。

實驗結果

論文在常用的 6 種資料集上做了實驗，有 ECSSD [8], PASCALS [9], DUT-OMRON [10], HKU-IS [11], SOD [12] 和 DUTS [13], 使用二值交叉熵做顯著性檢測，平衡二值交叉熵（balanced binary cross entropy）[14] 作為邊緣檢測（edge detection）。

以下是文章方法跟目前 state-of-the-arts 的方法的對比效果，綠框是 GT，紅框是本文效果。可以看到無論在速度還是精度上都有很大的優勢。

CVPR 2019 | PoolNet：基於池化技術的顯著性目標檢測

論文還針對三個改進的技術 PPM、GGFs 和 FAMs 的不同組合做了實驗，(a) 是原圖，(b) 是 Ground truth，(c) 是 FPN 的結果，(d) 是 FPN+FAMs，(e) 是 FPN+PPM，(f) 是 FPN+GGM，(g) 是 FPN+GGM+FAMs。

CVPR 2019 | PoolNet：基於池化技術的顯著性目標檢測

總結

該 paper 提出了兩種基於池化技術的模組 GGM（全域性引導模組）和 FAM（特徵整合模組），改進 FPN 在顯著性檢測的應用，而且這兩個模組也能應用在其他金字塔模型中，具有普遍性，但是 FAM 的整合過程我認為有點像是用平均中和了上取樣帶來的混疊效應，但是不夠優雅，先下采樣池化再上取樣帶來的損失可能代價太大。

參考文獻

[1]. Hengshuang Zhao, Jianping Shi, Xiaojuan Qi, Xiaogang Wang, and Jiaya Jia. Pyramid scene parsing network. In CVPR, 2017. 1, 3.

[2]. Tiantian Wang, Ali Borji, Lihe Zhang, Pingping Zhang, and Huchuan Lu. A stagewise refinement model for detecting salient objects in images. In ICCV, pages 4019–4028, 2017. 1, 3, 6, 7, 8.

[3].Nian Liu and Junwei Han. Dhsnet: Deep hierarchical saliency network for salient object detection. In CVPR, 2016.1, 2, 3, 7, 8.

[4]. Qibin Hou, Ming-Ming Cheng, Xiaowei Hu, Ali Borji, Zhuowen Tu, and Philip Torr. Deeply supervised salient object detection with short connections. IEEE TPAMI, 41(4):815–828, 2019. 1, 2, 3, 5, 6, 7, 8.

[5]. Tiantian Wang, Ali Borji, Lihe Zhang, Pingping Zhang, and Huchuan Lu. A stagewise refinement model for detecting salient objects in images. In ICCV, pages 4019–4028, 2017. 1, 3, 6, 7, 8.

[6]. Tiantian Wang, Lihe Zhang, Shuo Wang, Huchuan Lu, Gang Yang, Xiang Ruan, and Ali Borji. Detect globally, refine locally: A novel approach to saliency detection. In CVPR, pages 3127–3135, 2018. 1, 3, 6, 7, 8.

[7]. Hengshuang Zhao, Jianping Shi, Xiaojuan Qi, Xiaogang Wang, and Jiaya Jia. Pyramid scene parsing network. In CVPR, 2017. 1, 3.

[8]. Qiong Yan, Li Xu, Jianping Shi, and Jiaya Jia. Hierarchical saliency detection. In CVPR, pages 1155–1162, 2013. 1, 5, 8.

[9]. Yin Li, Xiaodi Hou, Christof Koch, James M Rehg, and Alan L Yuille. The secrets of salient object segmentation. In CVPR, pages 280–287, 2014. 5, 7, 8.

[10]. Chuan Yang, Lihe Zhang, Huchuan Lu, Xiang Ruan, and Ming-Hsuan Yang. Saliency detection via graph-based manifold ranking. In CVPR, pages 3166–3173, 2013. 5, 6, 7, 8.

[11]. Guanbin Li and Yizhou Yu. Visual saliency based on multiscale deep features. In CVPR, pages 5455–5463, 2015. 2, 5, 6, 7, 8.

[12]. Vida Movahedi and James H Elder. Design and perceptual validation of performance measures for salient object segmentation. In CVPR, pages 49–56, 2010. 5, 6, 7, 8.

[13]. Lijun Wang, Huchuan Lu, Yifan Wang, Mengyang Feng, Dong Wang, Baocai Yin, and Xiang Ruan. Learning to detect salient objects with image-level supervision. In CVPR, pages 136–145, 2017. 5, 7, 8.

[14]. Saining Xie and Zhuowen Tu. Holistically-nested edge detection. In ICCV, pages 1395–1403, 2015. 6.

CVPR 2019|PoolNet:基於池化技術的顯著性檢測論文解讀
2019-05-27
CVPR2017-目標檢測相關
2020-04-06
CVPR2021 | 開放世界的目標檢測
2021-07-02
CVPR 2019 | 天秤座R-CNN：全面平衡的目標檢測器
2019-04-26
CNN
2019 年的目標檢測指南
2019-08-14
CVPR2019 | 史丹佛學者提出GIoU，目標檢測任務的新Loss
2019-03-10
AAAI 2019 論文解讀 | 基於區域分解整合的目標檢測
2019-03-04
AI
多角度SAR動目標檢測技術
2020-10-07
目標檢測模型——SPP （空間金字塔池化）
2021-01-01
模型
2D目標檢測綜述 2020 CVPR ECCV
2020-09-30
3D目標檢測技術有哪些好用的模型？
2024-03-10
3D模型
做目標檢測，這一篇就夠了！2019最全目標檢測指南
2019-09-29
TF專案實戰（基於SSD目標檢測）——人臉檢測1
2019-07-20
大疆、港科大聯手！雙目3D目標檢測實驗效果大放送 | CVPR 2019
2019-03-11
3D
0-目標檢測模型的基礎
2022-12-01
模型
目標檢測
2018-04-24
基於OpenCV和YOLOv3深度學習的目標檢測
2019-04-16
OpenCVYOLO深度學習
基於混合高斯模型的運動目標檢測演算法
2018-07-21
模型演算法
從滑動視窗到YOLO、Transformer：目標檢測的技術革新
2023-12-17
YOLOORM
CVPR 2019 | 基於級聯生成式與判別式學習的乳腺鉬靶微鈣化檢測
2019-05-07
PackageDNA檢測目標軟體包的安全性
2021-10-13
Package
DeepVS：基於深度學習的影片顯著性方法
2018-09-26
深度學習
移動應用隱私合規檢測簡介及目標檢測技術的應用
2022-10-12
2018目標檢測
2018-08-27
九、目標檢測
2024-10-03
CVPR 2018|Cascade R-CNN：向高精度目標檢測器邁進
2019-03-04
CNN
你要的2019最全目標檢測都在這裡啦！
2020-04-06
基於深度學習的計算機視覺應用之目標檢測
2018-04-02
深度學習計算機視覺
《基於深度學習的目標檢測綜述》論文獲發表
2023-01-30
深度學習
基於pytorch的目標檢測資料增強（tensor資料流版本）
2021-02-03
PyTorch
目標檢測---教你利用yolov5訓練自己的目標檢測模型
2022-06-14
YOLO模型
基於全流量許可權漏洞檢測技術
2020-07-08
目標檢測技術演化：從R-CNN到Faster R-CNN
2018-07-27
CNNAST
CVPR 2022資料集彙總｜包含目標檢測、多模態等方向
2022-04-18
2-2. 線性池技術優化
2019-07-23
優化
目標檢測之SSD
2018-12-18
目標檢測之RetinaNet
2018-12-19
NaN
目標檢測面面觀
2018-09-04

CVPR 2019 | PoolNet：基於池化技術的顯著性目標檢測

研究動機

模型架構

兩個模組

實驗結果

總結

參考文獻

相關文章