《Object Detection Using ClusteringAlgorithm Adaptive Searching Regions in Aerial Images》論文10問
Q1 論文試圖解決什麼問題?
- 小物體分佈不均勻,主要問題是解析度低、資訊量小,導致特徵表達能力弱;傳統方法如放大影像,會增加處理時間和儲存大型特徵圖所需的記憶體,影像統一均勻裁剪成多個區域,忽略了物體的稀疏性,可能會浪費計算資源。
- 物體大小的多樣性,如何設定錨的大小是一個很大的問題。對於無錨檢測器,很難直接回歸物體的寬度和高度。
- 但是,基於錨點的檢測器依賴於良好的先驗錨點,而在物體尺寸變化較大的情況下,很難估計出合適的先驗錨點。
Q2 這是否是一個新的問題?
不是
- 對於小物體分佈不均勻,對於小影像的處理,過去有放大影像,影像均勻裁剪等策略
Q3 這篇文章要驗證一個什麼科學假設?
- 物體分佈不均勻,可以將檢測器集中在這些有大量物體的區域提高檢測效率。
- 物體的大小存在巨大差異,要儘可能縮小影像間物體大小的差異。
Q4 有哪些相關研究?如何歸類?誰是這一課題在領域內值得關注的研究員?
4.1 檢測器
主流的物體檢測演算法主要基於深度卷積神經網路,可分為兩類:基於錨的檢測器和無錨檢測器。基於錨的檢測器又可分為兩階段檢測器和單階段檢測器兩類。
- 兩階段檢測器的代表包括 R-CNN 系列 [9,10,29] 和 Mask RCNN [11]。
- 單級檢測器的代表有 SSD 系列 [7,19]、YOLO 系列 [1,26-28]、RetinaNet [17] 等。
4.2 利用深度神經網路進行航空影像檢測
- 在[34]中,研究者研究了航空影像目標檢測的尺度變化,提出了一種接受域擴充套件塊(RFEB)來增加高階語義特徵的接受域大小,並提出了一種空間細化模組(SRM)來修復空間細節。
- 文獻[25]提出了一種多工目標檢測與分割模型。將分割圖作為自關注機制的權重,對目標檢測的特徵圖進行加權,減少了不相關區域的訊號。
4.3 檢測中的區域搜尋
- [20]的工作提出了一種自適應檢測策略
- [31,37]中的方法,首先利用聚類演算法在原始資料集上得到ROI的ground truth,然後利用一個特殊的CNN對ROI進行預測,最後將ROI傳送給精細檢測器。
- [42],在特徵圖上採用滑動視窗法,然後計算每個視窗的難度分數,並將難度區域傳送給精細檢測器。
- [8,32,33]解決了大影像中的小目標檢測問題,採用強化學習方法尋找ROI進行精細檢測。
- [15]提出了一種基於密度圖的航拍影像目標檢測網路。
Q5 論文中提到的解決方案之關鍵是什麼?
- 將初始檢測結果輸入均值移動[39]聚類演算法,可以自適應地獲得影像的聚類區域,解決物體分佈不均勻的問題
- 高斯比例函式(GSF)可用於縮小大型物體和放大小型物體,解決物體尺度大小的多樣性
Q6 論文中的實驗是如何設計的?
6.1 消融實驗
測聚類演算法,難度閾值和高斯縮放函式(GSF)如何影響最終效能
Q7 用於定量評估的資料集是什麼?程式碼有沒有開源?
- VisDrone
Q8 論文中的實驗及結果有沒有很好地支援需要驗證的科學假設?
實驗結果表明,APsmall和APmedium演算法有較大的改進,說明本文提出的自適應裁剪區域聚類演算法對中小目標的檢測有很大的幫助。