圖片質量評估論文 | 無監督SER-FIQ | CVPR2020

忽逢桃林發表於2021-01-14

文章轉自:同作者微信公主號【機器學習煉丹術】。歡迎交流,共同進步。

  • 論文名稱:SER-FIQ: Unsupervised Estimation of Face Image Quality Based on Stochastic Embedding Robustness
  • 論文連結:https://arxiv.org/abs/2003.09373

0 綜述


這可能是我看CVPR論文中,唯一一個5分鐘就看完原理的論文了,簡單有趣。這一篇文章是CVPR2020的與影像質量評估相關的文章,整體思想比較新穎,而且是無監督的方式,感覺構思不錯,我要好好讀讀這一篇。

1 細節

人臉質量評估的目的是評估一個人臉圖片與面部識別演算法的適用性,什麼是高質量的人臉圖片?不是看的清晰的,而是可以正確被面部識別演算法識別的。

基於這種思想,計算人臉識別演算法的隨機子網路的輸出的方差,得到圖片的魯棒性,從而反應圖片的質量,如下圖:

上圖中的隨機子網路,其實就是dropout實現的全連線層,所以要求人臉識別模型中必須包含dropout層。

作者對於每個圖片,隨機構建了m個隨機子網路,然後對m個輸出計算方差。我們用數學來表示這m個隨機子網路的輸出:

\(X(I)=\{x_s\}, s \in {1,2,...,m}\)

其中I表示原始影像,m為隨機子網路的數量,\(s_m\)表示第m個隨機子網路,輸入I的時候的輸出。

那麼我們用下面的公式來計算影像I的quality score:

這樣質量分數是在0和1之間的一個數字。


這個流程圖也很簡單,跟我們剛才說的一樣。

2 總結


上圖是一個實驗結果圖,不同模型的之間的對比。論文後面用大量篇幅在各種人面識別模型和資料集上做實驗和對比,這裡就不多描述了。回頭有機會,這個方法可以試一試,簡單又有意思。

相關文章