重磅!目前最強效能的人臉檢測演算法(Wider Face Dataset)

磐創AI發表於2019-02-19

重磅!目前最強效能的人臉檢測演算法(Wider Face Dataset)

轉載自:計算機視覺戰隊

未經允許不得二次轉載

今天我們不說計算機視覺基礎知識,接下來說說AAAI2019一篇比較新穎的Paper,其是中科院自動化所和京東AI研究院聯合的結果,Wider Face資料集中達到了較高的水準,比arxiv2019_VIM-FD的更好一些。今天要說的就是“Improved SRN”,現在開始一起學習吧!

Improved SRN

人臉檢測作為計算機視覺中的一個長期存在的問題,由於其實際應用,近幾十年來一直受到人們的關注。

隨著人臉檢測基準資料集的廣泛應用,近年來各種演算法都取得了很大的進展。其中,Selective Refinement Network(SRN)人臉檢測器有選擇地將分類和迴歸操作引入到anchor-based的人臉檢測器中,以減少假陽性同時提高定位精度。此外,它還設計了一個感受野增強塊,以提供更多樣化的感受野。

重磅!目前最強效能的人臉檢測演算法(Wider Face Dataset)

為了進一步提高SRN的效能,透過大量的實驗,開發了現有的一些技術,包括新的資料增強策略、改進的backbone networkMS COCO預訓練、解耦分類模組(decoupled classification module)、分割分支和壓縮激勵塊(Squeeze-and-Excitation block)。

其中,一些技術帶來了效能改進,因此,將這些有用的技術結合在一起,提出了一種改進的SRN人臉檢測器,並在廣泛使用的人臉檢測基準的人臉資料集上獲得了最佳的效能。

人臉檢測其實比較簡單,就是將影像輸入演算法框架中,最終返回輸入影像中目標人臉的bounding box。

重磅!目前最強效能的人臉檢測演算法(Wider Face Dataset)

Review of Baseline

接下來,我們先簡要回顧Selective Refinement Network(SRN。如下圖1所示,它包括選擇性兩步分類(STC)、選擇性兩步迴歸(STR)和感受野增強(RFE),這三個模組的詳細說明如下。

重磅!目前最強效能的人臉檢測演算法(Wider Face Dataset)

圖1 SRN。它包括選擇性兩步分類(STC)、選擇性兩步迴歸(STR)和感受野增強(RFE)。

01

S T C

對於單級檢測器,大量的正負樣本比的anchor(例如,大約有300k個anchor,SRN中的正/負比約為0.006%)導致了相當多的假陽性。因此,它需要另一個階段,如RPN過濾掉一些負樣本。選擇性兩步分類是從RefineDet繼承而來的,有效地拒絕了大量的負樣本anchor,緩解了類不平衡問題。

STC作用於淺層Feature Map上,來過濾掉大部分比驕傲容易區分的負樣本,來減少搜尋空間。

S T R

像Cascade RCNN這樣的多步迴歸可以提高Bounding Box位置的準確性,特別是在一些具有挑戰性的場景中,例如MS COCO風格的評估指標。然而,將多步迴歸應用於人臉檢測任務中,如果不仔細考慮,可能會影響檢測結果。

STR作用於高層Feature Map上,用來粗略調整anchor的尺度、位置(類似於RefineDet中ARM的迴歸任務),並進一步為高層Feature Map上的迴歸器提供refined後的anchor位置初始化(類似於RefineDet中ODM的迴歸任務)。

03R F E

當前網路通常都具有square感受野,這影響了對不同高寬比目標的檢測。為了解決這個問題,SRN設計了一個感受野增強(RFE),在預測類和位置之前,將特徵的感受野多樣化,這有助於在某些極端姿勢中很好地捕捉到人臉。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31555081/viewspace-2636352/,如需轉載,請註明出處,否則將追究法律責任。

相關文章