業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

大資料文摘發表於2018-12-18

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

大資料文摘出品

編譯:張秋玥、蔣寶尚

你能看出上面兩張圖片,哪張是真的,哪張是假的麼?文摘菌是分不出來,太像了!

這種以假亂真的圖片生成技術來源於一種左右互博術—生成對抗網路(GAN)。

這一概念由機器學習研究者Ian Goodfellow在2014年提出。之所以叫“生成”是因為該模型的輸出為影像一類的資訊,而非與輸入資料相關的預測值(比如“該影像是否是根熱狗”的預測);“對抗網路”則是因為該模型使用兩組貓鼠遊戲一般相互競爭的神經網路,就像收銀員和偽造者鬥智鬥勇一樣:一方試圖欺騙另一方認為它拿的真實鈔票,而另一方則試圖區分鈔票的真偽。

其實,最開始的那一批生成對抗網路(GAN)影像很容易就能被發現不是真實照片。

比如2014年的這些圖片:

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

Radford等,2014,無監督代表學習與深度卷積生成對抗網路(也被縮寫為DCGAN)

但2017年10月釋出的最新GAN生成影像就不那麼好區分了:

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

Karras等,2017,改進質量、穩定性與變化程度的GAN網路(也被縮寫為PGAN或ProGAN)

如何識別出GAN生成的影像?應該著重強調面部的問題,因為絕大多數研究者們都是使用人臉影像來進行試驗的,並且許多人臉影像中會出現的問題經常也會在其他型別影像中出現。

以下是識別虛假影像的幾個要點:

看似畫筆塗上的直髮

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像


長髮很容易出現這種超級直的效果——只有一小把的話看起來其實還挺好的,但一大把直髮看起來就像是有人用畫刀或者大筆刷塗了一把丙烯酸顏料上去一樣。

難以辨認的文字

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

訓練於生成人臉的GAN模型不太能夠抓住背景中的複雜結構。此外,GAN模型同時顯示訓練資料的原始與映象版本,這意味著他們不太能夠抓住文字的特徵因為它一般只在單一方向出現。

超現實風格背景

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

GAN模型生成人臉很可信的一個原因就是,所有的訓練資料都被歸一化了。這意味著,當涉及到例如眼睛與耳朵的位置與渲染問題時,GAN模型的可變度會很小。另一方面,背景則可以包含任何內容了。對於GAN模型來說,模擬出一個像樣的背景實在有些過分了——他們最終一般就複製出一般性的紋理樣背景,而非“真實”場景。

不對稱性

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

GAN模型有時很難處理影像中的長距離依賴性。儘管在訓練資料中耳環一類的配飾通常都是成對出現,生成影像中通常並非如此。還有這種情況:人眼通常看向同一方向並呈現相同顏色,但生成影像中的眼睛經常是對對眼,還可以是異瞳色呢。高度或大小非常不匹配的耳朵也是一種常見的不對稱性。

奇怪的牙齒

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

GAN模型能夠勝任生成一般性的場景,但目前為止它還不太能夠搞定半規則重複細節問題,比如牙齒。有時GAN模型會產生錯位牙齒,或者以很奇怪的方式拉伸或收縮單個牙齒。這個問題在其他領域也出現過,比如磚類影像的紋理合成問題。

凌亂的頭髮

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

這是識別GAN生成影像最快方法之一。通常情況下,GAN會讓頭髮看起來盤曲打結,在肩膀周圍隨機形成一縷一縷的髮束,並在額頭上留下厚厚的雜散毛髮。髮型可以非常多變,還可以擁有許多細節,因此它是最難以用GAN捕捉的特徵之一。非毛髮類物體有時甚至可以被變成頭髮狀紋理。

安能辨我是雄雌

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

這個GAN模型是在CelebA資料集的一個子集上訓練的,其中包含約一萬個名人的20萬張人臉影像。在這個資料集中,我沒有見到有誰有面部毛髮,耳環或者化妝;但GAN模型還是經常分不清不同性別特徵。更一般地說,我覺得這是因為GAN模型並不總是學習人類社會所強調的二元論(比如這裡的“非男即女”)。

半規則噪聲

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

有些本應當為單色的區域可能會出現具有水平或垂直條帶的半規則噪聲。在本例中,可能是因為模型在試圖模仿布料的質地。舊一點的GAN模型一般噪聲模式更明顯,我們稱之為“棋盤效應”(Checkerboard Artifacts)。

棋盤效應:

https://distill.pub/2016/deconv-checkerboard/

染色問題

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

一些顏色較淺並且為純色的區域可能會出現多色調染色問題,比如衣領、脖子與眼白(未在本例出現)。

真實影像的例子

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

看看這些清晰的背景文字,對稱的耳環,大小相同的牙齒以及細節豐富的髮型。學習完以上這些小技巧後你可以試試玩一些小遊戲,來看你是不是真的能夠區分真假圖片啦。

業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像

遊戲:http://nikola.mit.edu/experiment

相關報導:

https://medium.com/@kcimc/how-to-recognize-fake-ai-generated-images-4d1f6f9a2842

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2285642/,如需轉載,請註明出處,否則將追究法律責任。

相關文章