人臉影像是整個影像領域裡面研究人員最多,應用最廣的一個方向。GAN作為時下最新興的深度學習模型,在人臉影像領域裡已經頗有建樹,今天我們們就聊聊GAN對人臉影像演算法的一些主要影響。
文/編輯 | 言有三
人臉檢測
人臉檢測是一個古老的課題了,從傳統演算法發展到深度學習演算法,已經非常的成熟,不過這並不是意味著完美。GAN在人臉檢測領域中的貢獻主要體現在小臉的超分辨上。
以文[1]為代表,生成器使用了一個超解析度網路(super-resolution network)和一個改進網路(refinement network)對模糊的小臉進行上取樣,能夠提高wider face難測試集(Hard subset)的結果。
[1] Bai Y, Zhang Y, Ding M, et al. Finding tiny faces in the wild with generative adversarial network[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 21-30.
遮擋人臉恢復與姿態模擬
人臉識別演算法發展了很久也已經在工業界大規模應用,但是它的難題仍然是很明顯的,遮擋就是其中一個大問題,GAN可以被應用於遮擋人臉的恢復。
另一方面,姿態對人臉識別等演算法的影響非常大,也會造成上述的遮擋問題,將GAN用於姿態模擬,比如正臉化,將非常有助於人臉識別等模型的效能提升。FF-GAN[2]是其中的代表性模型,它是一個基於3DMM模型的條件GAN。
[2] Yin X, Yu X, Sohn K, et al. Towards large-pose face frontalization in the wild[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 3990-3999.
年齡與表情模擬
跨年齡的人臉識別和驗證是一個非常具有挑戰性的問題,如果能對年齡進行歸一化,去除年齡因素的干擾,將大大提升跨年齡人臉識別的精度。
表情與年齡一樣,也會對人臉識別演算法構成一定挑戰,年齡和表情編輯同時還是一個兼具娛樂性的應用方向,GAN在其中大有可為。
[3] Antipov G, Baccouche M, Dugelay J L. Face aging with conditional generative adversarial networks[C]//2017 IEEE International Conference on Image Processing (ICIP). IEEE, 2017: 2089-2093.
[4] Song L, Lu Z, He R, et al. Geometry guided adversarial facial expression synthesis[C]//2018 ACM Multimedia Conference on Multimedia Conference. ACM, 2018: 627-635.
換臉演算法與偽造臉識別
換臉演算法有很多種,不過時下最流行的自然是基於GAN的演算法,使得換臉已經從實驗室走向了工業界,甚至達到了以假亂真的效果。當然,一個工業級的應用肯定還需要GAN以外其他領域技術的輔助,我們後面會給大家介紹。
目前多個大規模的偽造資料集[6]也被髮布,檢測偽造臉的研究才剛剛開始,面臨著巨大的挑戰,只希望科技能儘量向善。
[5] Korshunov P, Marcel S. Deepfakes: a new threat to face recognition? assessment and detection[J]. arXiv preprint arXiv:1812.08685, 2018.
[6] FaceForensics++: Learning to Detect Manipulated Facial Images
人臉美顏與風格化
人臉美顏是一個由來已久的研究課題,傳統的方法多是基於濾波演算法和幾何變換,可以實現磨皮美白以及臉型調整。隨著GAN的流行,更多的個性化操作變得可行,比如人臉的妝造遷移,以BeautyGAN[7]為其中的典型代表。
另一方面,頭像風格化等應用[8]在娛樂社交領域也有很重要的一席之地,感興趣的可以跟進。
[7] Li T, Qian R, Dong C, et al. Beautygan: Instance-level facial makeup transfer with deep generative adversarial network[C]//2018 ACM Multimedia Conference on Multimedia Conference. ACM, 2018: 645-653.
[8] Kim J, Kim M, Kang H, et al. U-GAT-IT: unsupervised generative attentional networks with adaptive layer-instance normalization for image-to-image translation[J]. arXiv preprint arXiv:1907.10830, 2019.
如何進行實戰深造
上面簡略地介紹了GAN在人臉影像領域中的主要應用,還有一些通用的屬性編輯內容沒有講述。上述的每一個方向細細深究都會有非常多的內容,值得想在人臉演算法領域有所建樹的同學跟進。學習GAN可以參考: