A Simple Semi-Supervised Learning Framework for Object Detection

alibabazhouyu發表於2020-12-10

熱門的半監督學習方法大部分是基於一致性自訓練的。半監督的核心思想是先為無標註的資料生成人工標籤,然後訓練模型預測這些人工標籤。預測的人工標籤可以是one-hot也可以是預測分佈(soft)。SSL成功的另一個支柱是資料增強的進步。資料增強提高了深度神經網路的魯棒性。並且已經證明對於基於一致性的自訓練特別有效。複雜的資料增強策略,例如RandAugment 和CTAugment ,對SSL的影像分類非常有效。用於物件檢測的SSL僅有的研究大多依賴於額外的上下文,例如物件的類別相似性。本來利用從影像分類中學到的經驗到目標檢測中。本文結合自訓練(通過偽標籤)和基於強資料增強的一致性歸一化來做目標檢測。第一階段:首先使用所有標註的資料來訓練目標檢測器直到收斂。然後,檢測器用於預測無標籤的影像得到需要的標籤,這些結果經過NMS和閾值處理之後得到最終精確的標籤。第二階段中:首先再無標籤的影像上做強的資料增強RandAugment(本文包括全域性顏色變換,全域性或者邊框的集合變換,cutout等),然後使用有表情的影像和無標籤的影像(經過資料增強的?)以及第一階段預測的對應的偽標籤來訓練模型。本文還設計了新的experimental protocols來評估實驗效果。分別使用 1%, 2%, 5% and 10%的訓練集作為全標籤資料集,剩下的為無標籤資料來訓練模型。使用VOC07的trainval作為標記集,使用MS-COCO的有或沒有未標記資料的VOC12的trainval作為未標記集。

貢獻如下:
1.我們開發了STAC,這是一種用於物件檢測的半監督學習框架,可無縫擴充套件基於自訓練和增強驅動的一致性正則化的最新SSL分類方法。
2. STAC很簡單,僅引入了兩個新的超引數:置信度閾值τ和無監督loss權重λu,這不需要大量額外的調整工作。
3.我們提出了使用MS-COCO進行SSL物件檢測的新實驗協議(protocol),並在Faster RCNN框架中證明了STAC對MS-COCO和PASCAL VOC的有效性。如何使用偽標籤對於半監督學習至關重要。

本文使用偽標籤,偽框,和資料增強來增強目標檢測。資料擴充對於提高模型泛化性和魯棒性至關重要,尤其是逐漸成為半監督學習的主要動力。輸入空間的適當顏色變換和幾何變換對於提高泛化能力至關重要。

無監督學習的無監督損失:制定無監督資料的無監督loss是無監督學習的關鍵。對於K-way分類,一致性歸一化為:

在此,p表示由θ引數化的模型的預測。

STAC: SSL for Object Detection:本文首先採用NoisyStudent的階段性訓練,以提高其可伸縮性和靈活性,設計至少兩個階段的訓練:1. 使用有標籤資料來訓練一個教師模型,2.使用標籤資料和無標籤資料來訓練模型,這些偽標籤需要使用高閾值和一些別的手段來得到高質量的偽標籤。

訓練STAC的步驟如下:

1.在可用的標籤影像上訓練教師模型。
2.使用訓練好的教師模型生成無標籤影像的偽標籤(即邊界框及其類標籤)。
3.對未標記的影像應用強大的資料增強,並在應用全域性幾何變換時變換相應的偽標記(即邊界框)。
4.計算無監督損失和有監督損失以訓練檢測器。

無監督loss: 給定一個無標籤影像X,一系列預測的邊框和得分,我們確定qi *,即所有anchor的anchor i相對於偽框的二進位制標籤。

Data Augmentation Strategy: 基於一致性的SSL方法(例如UDA [59]和FixMatch [50])成功的關鍵因素是強大的資料增強。這裡擴充套件了RandAugment,使用最近提出的擴充搜尋空間(例如,box-level變換)以及Cutout。

1. Global color transformation:操作和強度都是[7]中的; 2. Global geometric transformation:x-y translation, rotation, and x-y shear, are used;3. Box-level transformation: 跟2一樣,但是幅度較小;

資料增強的順序:首先進行顏色變換,然後使用全域性或者box-level變換,最後,在圖上進行隨機遮擋。

 

 

 

相關文章