業界 | GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像
大資料文摘出品
編譯:張秋玥、蔣寶尚
你能看出上面兩張圖片,哪張是真的,哪張是假的麼?文摘菌是分不出來,太像了!
這種以假亂真的圖片生成技術來源於一種左右互博術—生成對抗網路(GAN)。
這一概念由機器學習研究者Ian Goodfellow在2014年提出。之所以叫“生成”是因為該模型的輸出為影像一類的資訊,而非與輸入資料相關的預測值(比如“該影像是否是根熱狗”的預測);“對抗網路”則是因為該模型使用兩組貓鼠遊戲一般相互競爭的神經網路,就像收銀員和偽造者鬥智鬥勇一樣:一方試圖欺騙另一方認為它拿的真實鈔票,而另一方則試圖區分鈔票的真偽。
其實,最開始的那一批生成對抗網路(GAN)影像很容易就能被發現不是真實照片。
比如2014年的這些圖片:
Radford等,2014,無監督代表學習與深度卷積生成對抗網路(也被縮寫為DCGAN)
但2017年10月釋出的最新GAN生成影像就不那麼好區分了:
Karras等,2017,改進質量、穩定性與變化程度的GAN網路(也被縮寫為PGAN或ProGAN)
如何識別出GAN生成的影像?應該著重強調面部的問題,因為絕大多數研究者們都是使用人臉影像來進行試驗的,並且許多人臉影像中會出現的問題經常也會在其他型別影像中出現。
以下是識別虛假影像的幾個要點:
看似畫筆塗上的直髮
長髮很容易出現這種超級直的效果——只有一小把的話看起來其實還挺好的,但一大把直髮看起來就像是有人用畫刀或者大筆刷塗了一把丙烯酸顏料上去一樣。
難以辨認的文字
訓練於生成人臉的GAN模型不太能夠抓住背景中的複雜結構。此外,GAN模型同時顯示訓練資料的原始與映象版本,這意味著他們不太能夠抓住文字的特徵因為它一般只在單一方向出現。
超現實風格背景
GAN模型生成人臉很可信的一個原因就是,所有的訓練資料都被歸一化了。這意味著,當涉及到例如眼睛與耳朵的位置與渲染問題時,GAN模型的可變度會很小。另一方面,背景則可以包含任何內容了。對於GAN模型來說,模擬出一個像樣的背景實在有些過分了——他們最終一般就複製出一般性的紋理樣背景,而非“真實”場景。
不對稱性
GAN模型有時很難處理影像中的長距離依賴性。儘管在訓練資料中耳環一類的配飾通常都是成對出現,生成影像中通常並非如此。還有這種情況:人眼通常看向同一方向並呈現相同顏色,但生成影像中的眼睛經常是對對眼,還可以是異瞳色呢。高度或大小非常不匹配的耳朵也是一種常見的不對稱性。
奇怪的牙齒
GAN模型能夠勝任生成一般性的場景,但目前為止它還不太能夠搞定半規則重複細節問題,比如牙齒。有時GAN模型會產生錯位牙齒,或者以很奇怪的方式拉伸或收縮單個牙齒。這個問題在其他領域也出現過,比如磚類影像的紋理合成問題。
凌亂的頭髮
這是識別GAN生成影像最快方法之一。通常情況下,GAN會讓頭髮看起來盤曲打結,在肩膀周圍隨機形成一縷一縷的髮束,並在額頭上留下厚厚的雜散毛髮。髮型可以非常多變,還可以擁有許多細節,因此它是最難以用GAN捕捉的特徵之一。非毛髮類物體有時甚至可以被變成頭髮狀紋理。
安能辨我是雄雌
這個GAN模型是在CelebA資料集的一個子集上訓練的,其中包含約一萬個名人的20萬張人臉影像。在這個資料集中,我沒有見到有誰有面部毛髮,耳環或者化妝;但GAN模型還是經常分不清不同性別特徵。更一般地說,我覺得這是因為GAN模型並不總是學習人類社會所強調的二元論(比如這裡的“非男即女”)。
半規則噪聲
有些本應當為單色的區域可能會出現具有水平或垂直條帶的半規則噪聲。在本例中,可能是因為模型在試圖模仿布料的質地。舊一點的GAN模型一般噪聲模式更明顯,我們稱之為“棋盤效應”(Checkerboard Artifacts)。
棋盤效應:
https://distill.pub/2016/deconv-checkerboard/
染色問題
一些顏色較淺並且為純色的區域可能會出現多色調染色問題,比如衣領、脖子與眼白(未在本例出現)。
真實影像的例子
看看這些清晰的背景文字,對稱的耳環,大小相同的牙齒以及細節豐富的髮型。學習完以上這些小技巧後你可以試試玩一些小遊戲,來看你是不是真的能夠區分真假圖片啦。
遊戲:http://nikola.mit.edu/experiment
相關報導:
https://medium.com/@kcimc/how-to-recognize-fake-ai-generated-images-4d1f6f9a2842
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2285642/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 生成假人臉、假新聞...AI虛擬世界正形成AI虛擬世界
- 誰來識別AI生成的假新聞?英媒:解鈴還須系鈴“人”AI
- GAN生成影像綜述
- 領英1000多個假賬戶被曝光,用AI生成假臉冒充真人發推銷資訊,已形成相關產業鏈AI產業
- Android 超簡單整合活體檢測技術 快速識別“假臉”Android
- Laravel 生成假資料步驟Laravel
- Python-OpenCV人臉識別之資料集生成PythonOpenCV
- 識別特定影象的AI玻璃來了,未來或可用於人臉識別AI
- Python實現AI影像識別-身份證識別PythonAI
- 人臉識別影像的模糊度判別演算法的最佳化演算法
- 財報識別OCR,披露虛假財務報表
- DeepFaceDrawing: 使用草圖生成人臉影像
- 乾貨 | AI人臉識別之人臉搜尋AI
- 怕寫文件?AI自動生成程式碼文件的外掛AI
- Golang 開源庫分享:faker - 隨機生成有趣的假資料!Golang隨機
- 樹莓派利用OpenCV的影像跟蹤、人臉識別等樹莓派OpenCV
- iOS 二維碼生成以及識別iOS
- AI中的影像識別技術的原理及過程AI
- 好用≠濫用,人臉識別的公共應用邊界在哪裡?
- 影像識別
- AI太複雜?別怕!華為雲Model Arts讓你分分鐘玩轉AI!AI
- 這個網站用 AI 來創造無限數量的「假臉」網站AI
- vit中的生成分類識別符號介紹符號
- 千萬別被騙了,人工智慧的虛假繁榮,你瞭解嗎?人工智慧
- 加碼“狗臉識別”背後,曠視的AI商業化焦慮AI
- 人工智慧界的逃犯剋星不止人臉識別,聲紋識別也能助力公安追逃人工智慧
- 更新、挑錯、識別假新聞,MIT推出維基百科AI編輯系統MITAI
- 使用 GAN 生成新的遊戲角色遊戲
- OpenAI「假新聞」生成器GPT-2的最簡Python實現OpenAIGPTPython
- GAN生成影象綜述
- orange影像識別
- python影像識別Python
- 智慧影片分析ai影像精準智慧識別AI
- 金融級別的人臉識別支付?
- opencv 人臉識別OpenCV
- 小程式--人臉識別功能(百度ai)AI
- 華為雲 API 影像識別 Image 的趣味性—AI 識別邁克爾·傑克遜APIAI
- js如何生成唯一識別符號UUIDJS符號UI