目標檢測：Segmentation is All You Need ？

我愛計算機視覺發表於2019-05-07

原文網址 : http://www.jiqizhixin.com/articles/2019-05-07-9

對於目標檢測，從滑動視窗時代開始，我們已經習慣了候選區域特徵提取然後分類的套路，深度學習時代強大的特徵表示能力讓我們能夠探索不一樣的道路，比如：

ECCV18 Oral | CornerNet目標檢測開啟預測“邊界框”到預測“點對”的新思路

Grid R-CNN解讀：商湯最新目標檢測演算法

FoveaBox：目標檢測新紀元，無Anchor時代來臨！

通過定位特定語義點來定位目標。

而且Anchor-Free方法越來越流行，預先定義的Anchor降低計算量的同時，卻已經成為限制目標檢測精度提高的因素。

今天跟大家分享的一篇文章《Segmentation is All You Need》，可能又要顛覆大家的認知，我們不僅不需要Anchor，甚至我們思考目標檢測的方式都被侷限了！

論文作者資訊：

目標檢測：Segmentation is All You Need ？

論文作者來自牛津大學、湖南農業大學、SnowCloud公司。該論文已投NeurIPS 2019。

提出問題

在現代目標檢測應用中，目標部分被遮擋、環境光照差和目標相對場景過小等依然難以被解決。

下圖展示了這些極端的例子：

目標檢測：Segmentation is All You Need ？這些難以處理的情況幾乎都和演算法能夠選擇或者預定義正確的、尺度合理的候選區域有關係。

而計算機視覺任務中的分割，不對目標做任何位置和尺度的假設，對畫素進行無差別分類。

目標檢測可否直接用分割來完成呢？這就是作者要解決的問題。

演算法思想

既然是用分割來做目標檢測，那就需要有標註好的分割資料集。

作者使用目標檢測資料庫中目標的包圍框來計算目標的mask，即弱監督標註。

請看下面的例子：

目標檢測：Segmentation is All You Need ？

上面的影像來自我愛計算機視覺曾經報導的“數鋼筋”大賽DataFountain新上計算機視覺比賽-20萬鉅獎數鋼筋，在這些鋼筋端部的包圍框上計算內接橢圓，其包含的區域即可以認為是目標的弱監督畫素級標註了。

就像下面這幅蘋果影像，你很容易通過包圍框簡單得到蘋果的大致區域。

目標檢測：Segmentation is All You Need ？

完整的演算法示意圖如下：

目標檢測：Segmentation is All You Need ？

首先是生成弱監督標註資料，然後使用這些資料訓練語義分割（不是例項分割），推斷的時候，語義分割的結果轉化為二值影像，最後使用輪廓提取演算法找到不同的目標個體。

影像中往往有複雜的遮擋，比如：

目標檢測：Segmentation is All You Need ？

這需要在製作目標畫素級標註時考慮到，下圖是將目標包圍框轉化為畫素級標註的細化：

目標檢測：Segmentation is All You Need ？

作者稱這種標註方法為multimodal annotations（多模標註）。

推斷時，對二值影像進行輪廓查詢，作者設計了Run-data-based tracing 演算法。

目標檢測：Segmentation is All You Need ？

查詢到的不同的輪廓即為不同的目標個體。

對於極其小的目標的訓練，作者在此框架下引入vector field方法。示意圖如下：

目標檢測：Segmentation is All You Need ？

實驗結果

作者在三個資料集上進行了實驗，分別是數鋼筋大賽的資料、WiderFace人臉資料集和COCO 目標檢測資料集。

下圖是數鋼筋的結果：

目標檢測：Segmentation is All You Need ？

該文提出的演算法在引數量最少的情況下，精度最高，超過目標檢測state-of-the-art Cascade RCNN演算法。

下圖是在WiderFace人臉檢測資料集上的結果，依然超過了所有方法。

目標檢測：Segmentation is All You Need ？

最後是在COCO 資料集上的結果，該文演算法取得了與Mask RCNN 和 Cascade R-CNN相匹敵的精度。這類演算法才剛剛出來，應該還有很大改進空間！

目標檢測：Segmentation is All You Need ？

值得一提的是，作者對目標進行畫素級標註的方法，對於人臉和鋼筋這種實心的目標可能比較有效，對於自行車這種中間有很大空隙的，會不會有問題？

不知作者會不會進一步公佈在COCO資料集上不同類的檢測結果，應該很有趣。

另外作者目前沒有公開程式碼，也沒公佈推斷時間。

這篇文章顛覆了我們的認知，原來什麼框、什麼點也不需要，也可以做目標檢測！

也許是作者急於快點公佈演算法與實驗結果，以至於忘了在論文最後寫結論了^_^

目標檢測：Segmentation is All You Need ？

論文地址：

https://arxiv.org/abs/1904.13300v1

相關文章

理解BERT Transformer：Attention is not all you need！
2019-04-05
ORM
【P5】Attention Is All You Need
2020-11-13
經典譯文：Transformer--Attention Is All You Need
2024-05-12
ORM
[Paper Reading] KOSMOS: Language Is Not All You Need: Aligning Perception with Language Models
2024-03-27
【論文閱讀筆記】Transformer——《Attention Is All You Need》
2024-11-08
筆記ORM
目標檢測
2018-04-24
2018目標檢測
2018-08-27
九、目標檢測
2024-10-03
Attention isn’t all you need！BERT的力量之源遠不止注意力
2019-03-05
目標檢測之SSD
2018-12-18
目標檢測之RetinaNet
2018-12-19
NaN
目標檢測面面觀
2018-09-04
28-目標檢測
2024-08-27
目標檢測綜述
2020-12-13
目標檢測：二維碼檢測方案
2022-03-26
You Probably Dont Need Derived State
2018-07-27
目標檢測---教你利用yolov5訓練自己的目標檢測模型
2022-06-14
YOLO模型
目標檢測之YOLO系列
2018-12-18
YOLO
【目標檢測】Bounding Box Regression
2019-02-25
目標檢測發展方向
2018-08-09
SSD 目標檢測 Keras 版
2019-02-19
Keras
【目標檢測】R-CNN
2020-12-13
CNN
做目標檢測，這一篇就夠了！2019最全目標檢測指南
2019-09-29
深度學習之目標檢測與目標識別
2018-06-05
深度學習
[譯] You Might Not Need ES6
2019-03-03
Attention isn’t all you need！Mamba混合大模型開源：三倍Transformer吞吐量
2024-03-29
大模型ORM
馬斯克開源的 grok-1 底層 Transformer 模型論文《Attention is All You Need》
2024-03-25
馬斯克ORM模型
Object Detection(目標檢測神文)
2018-11-02
Object
目標檢測（Object Detection）總覽
2018-08-08
Object
2019 年的目標檢測指南
2019-08-14
目標檢測相關論文
2020-04-05
深度學習之目標檢測
2019-02-20
深度學習
目標檢測（一）：LeNet-5
2021-12-07
目標檢測資料集分析
2022-04-19
Everything you need to know about mobile app architecture
2019-01-14
APP
[AI開發]目標檢測之素材標註
2019-08-02
AI
目標檢測之FPN（Feature Pyramid Net）
2018-12-19
目標檢測演算法學習
2019-03-16
演算法