CVPR2017-目標檢測相關

老司機的詩和遠方發表於2020-04-06

(1)Speed/accuracy trade-offs for modern convolutional object detectors

其主要考慮三種檢測器(Faster RCNN,R-FCN,SSD)作為元結構,三種CNN網路(VGG,Inception,ResNet)作為特徵提取器,變化其他引數如影像解析度、proposals數量等,研究目標檢測系統準確率與速度的權衡關係。

(2)YOLO9000:Better, Faster, Stronger

其為YOLO升級版,其對YOLO方法作了一些改進,Better方面考慮(Batch Normalization, High Resolution, Anchor Boxes, Dimension Clusters, Direct location prediction, Fine-Grained Features, Multi-Scale Training),Faster方面提出一個新的Darknet-19結構。除此之外,其提出一個方法在目標檢測資料集與影像分類資料集上聯合訓練,主要構建了一個視覺內容分層樹結構WordTree。

(3)A-Fast-RCNN: Hard positive generation via adversary for object detection

其主要考慮學習一個對於遮擋和形變具有不變性的目標檢測器,收集各種狀態目標的大資料集的資料驅動策略存在一定問題,比如遮擋和形變服從長尾理論,因此提出學習一個對抗網路(ASTN,ASDN)生成具有遮擋和形變的困難樣本,通過生成器與檢測器的博弈,提升目標檢測器對於各種狀態物體的整體目標檢測效能。

(4)Feature Pyramid Networks for Object Detection

其主要考慮利用深度卷積網路固有的多尺度金字塔形層次結構來構建特徵金字塔,建立了一個具有橫向連線的自頂向下架構用於在所有尺度上構建高階語義特徵圖,FPN作為通用特徵提取器表現優異,論文研究表明,儘管深度ConvNets具有強大的表達能力和對尺度變化內在的魯棒性,使用金字塔表示來明確地解決多尺度問題仍然是重要的。

(5)RON: Reverse Connection with Objectness Prior Networks for Object Detection

其主要考慮兩個問題,多尺度目標定位和負樣本挖掘,並分別提出Reverse Connection使得網路能在CNN多尺度檢測目標和Objectness Prior減少目標的搜尋空間,最後通過多工損失聯合優化Reverse Connection、Objectness Prior和目標檢測器。

(6)Accurate Single Stage Detector Using Recurrent Rolling Convolution

其提出一個新型端到端訓練目標檢測網路,在多尺度特徵圖引入Recurrent Rolling Convolution結構建立“deep in context”的分類器和迴歸器,其主要也是考慮“top-down/bottom-up”的特徵整合。

(7)Mimicking Very Efficient Network for Object Detection

當前目標檢測器都需要從預訓練ImageNet分類模型初始化,其相比從零開始訓練能達到更好的效果,而預訓練影像分類模型對於檢測任務並非最優的,其主要考慮訓練高效檢測器而不需要ImageNet的預訓練。其研究已有的一個滿足檢測表現的網路如何指導其他網路的訓練,即利用一個檢測網路監督另一個更高效的網路並保持準確率,其提出特徵mimic技術。

(8)Perceptual Generative Adversarial Networks for Small Object Detection

小目標因其低解析度和噪聲表示檢測困難,現有方法主要考慮在多尺度學習所有目標的特徵表示,其受限於計算複雜度。其主要考慮建立單個架構來解決小目標檢測問題,該架構將小目標的表示提升到“super-resolved”,從而實現與大目標類似的特徵,從而對於檢測任務更加具有辨別能力。利用生成式對抗網路,其提出Perceptual GAN模型,通過縮小小目標與大目標的表示差異來改善小目標檢測。

相關文章