“假臉”橫行!這個良心網站教你如何成為“打假”專家

大資料文摘發表於2019-02-25


“假臉”橫行!這個良心網站教你如何成為“打假”專家

大資料文摘出品

作者:蔣寶尚、魏子敏

先做一個簡單的小測試。

這裡有幾組圖片,不要懷疑,每組圖片都有一張是合成的“假臉”。

“假臉”橫行!這個良心網站教你如何成為“打假”專家

左邊為假

“假臉”橫行!這個良心網站教你如何成為“打假”專家

右邊為假

“假臉”橫行!這個良心網站教你如何成為“打假”專家

左邊為假

StyleGAN:圖片生成新神器

上面的那三組圖片來自最近在reddit上爆火的一個網站——“哪張臉是真的(which face is real?)”,網友們非常熱情地將結果在網站上進行比拼,並貼出了測試結果。

你可以開啟下面的網址,自己進行更多的圖片識別測試?

http://www.whichfaceisreal.com/index.php

生成對抗網路(GAN)自從2014年Ian Goodfellow提出之後,到今天已經發生了天翻地覆的變化。

早期生成的圖片還非常“辣眼睛”,遠不能騙人。比如2004年的這批“假臉”。

“假臉”橫行!這個良心網站教你如何成為“打假”專家

但是經過十多年的發展,現在生成的圖片已經和真實的相差無幾了,不是老司機根本識別不出來。

比如說你在文章開頭看到的幾組圖片。說真的,文摘菌在剛剛開始玩的時候幾乎全靠“蒙”!有幾次甚至覺得假臉比真的臉還要逼真。

看了下相關介紹,果然,網站上所採用的圖片全部是用StyleGAN生成的。

StyleGAN來自英偉達,可以說是近期火遍全網的“造假”神器了。與其他生成器不同,StyleGAN可以根據需要更改生成影像的結果,繪製出的圖片更加逼真,不僅可以創造假的人類肖像,也被瘋狂應用於其他機器學習應用專案,例如汽車、房間、甚至是動漫人頭等。

“假臉”橫行!這個良心網站教你如何成為“打假”專家

假房網”:從圖片到文字描述均由計算機自動生成

上圖是在Reddit最近也頗多人討論的”假Airbnb”網站“,它也是由StyleGAN生成的,網站上的圖片和文字所描繪的根本不是實物。

網站地址:

https://thisairbnbdoesnotexist.com/

這隻假房生成網站每次重新整理都會出現一個虛假的房源,網頁上的照片、文字描述、釋出的人頭像均由計算機自動生成。由於使用的模型非常簡單,文字描述多有不合邏輯之處,但猛地一看還是能以假亂真。

StyleGAN最初是由英偉達在一篇論文中《一種用於生成式對抗網路的基於生成器體系結構的方式(A Style-Based Generator Architecture for Generative Adversarial Networks))

“假臉”橫行!這個良心網站教你如何成為“打假”專家

論文下載地址:

https://arxiv.org/pdf/1812.04948.pdf

據論文介紹,StyleGAN是一步一步地生成人工影像的,從非常低的解析度開始,一直到高解析度(1024×1024)。通過分別地修改網路中每個級別的輸入,它可以控制在該級別中所表示的視覺特徵,從粗糙的特徵(姿勢、面部形狀)到精細的細節(頭髮顏色),而不會影響其它的級別。

這種技術不僅可以更好地理解所生成的輸出,而且還可以產生最高水平的結果,即比以前生成的影像看起來更加真實的高解析度影像。

所以說,StyleGAN是一篇突破性的技術,它不僅可以生成高質量的和逼真的影像,而且還可以對生成的影像進行較好的控制和理解,甚至使生成可信度較高的假影像變得比以前更加的容易。在StyleGAN中提出的一些技術,特別是對映網路和自適應例項標準化(AdaIN),可能是未來許多在GAN方面創新的基礎。

“打假”有術!識別假圖片小技巧

這麼逼真的假圖片,就沒有辦法識別了麼?別慌,再聰明的AI在造假時,都還是會留下一些痕跡。專業的研究者們一邊造假,一邊也給大家留下了一些“打假”小技巧。

斑點

StyleGAN演算法雖然厲害,但是有個顯著的特點,就是生成的圖片往往會有閃亮的斑點,雖然這些斑點看起來像是照片放久了,化學反應的產物,但是這確是這些合成圖片致命的缺點。

這些斑點可以出現在圖片的任何地方,頭髮以及背景區域出現的概率最大。

“假臉”橫行!這個良心網站教你如何成為“打假”專家

這些有斑點的圖片,都是假的,都是用GAN合成的。

背景問題

另一個致命的缺點會出現在照片的背景圖上,神經網路在對人物影像的面部進行識別的時候,往往不會非常重視。在一些情況下,照片的背景會顯得非常的凌亂,不要多想,這並不是印象派的畫作,是神經網路在生成圖片的時候,對背景處理的不夠好。

“假臉”橫行!這個良心網站教你如何成為“打假”專家

眼鏡

即使StyleGAN已經非常強大,但是和他的前輩們一樣,同樣無法完美的處理眼鏡,最常見的問題是眼鏡的兩邊不是對稱的。就拿框架來說,通常合成的圖片,左邊的框架風格和後邊的框架風格不太一樣,如下圖,框架的一側有時候會出現彎曲以及鋸齒狀。

“假臉”橫行!這個良心網站教你如何成為“打假”專家

其他不對稱問題

除了眼鏡之外,有些時候面部毛髮也會出現不對稱問題。左耳和右耳佩戴的耳環也不一樣,以及衣領在左右兩側也會出現不同的形狀。

“假臉”橫行!這個良心網站教你如何成為“打假”專家

現在,對稱性往往是人臉生成演算法的一大挑戰,我們完全可以利用它的這個弱點,對其一擊致命。

頭髮

一般來說,合成的人物圖片,頭髮往往都不會很逼真, 有時在臉上或其他地方頭髮會斷開,如下第一張圖所示,有的時候人物的頭髮會太直,以及會呈現條紋狀。正如Kyle McDonald 所說,就像有人用調色刀弄亂了一堆丙烯酸樹脂。在一些情況下,頭髮周圍可能出現一些奇怪的光圈或者光暈,如中間那張圖所示:

“假臉”橫行!這個良心網站教你如何成為“打假”專家

背景熒光

另一個有趣的缺點是,熒光顏色有時會從背景出現到頭髮或面部。

“假臉”橫行!這個良心網站教你如何成為“打假”專家

牙齒

牙齒不容易渲染。 通常牙齒是奇數或不對稱的。 在某些情況下,合成的人物圖片會出現三顆大門牙。

“假臉”橫行!這個良心網站教你如何成為“打假”專家

如果你仍然對GAN生成的圖片感到恐懼,文摘菌曾經寫了更詳細的文章《GAN生成的假臉太逼真了!別怕,十招教你識別AI生成的假影像》來幫你識別假照片,戳這裡獲得更多技巧。

好了,現在你應該知道神經網路很難生成什麼東西了吧,你可以像找玩找茬遊戲一樣,找到每張合成圖片的致命缺點,培養你對識別真實圖片的信心。

“打假”技能考核開始

看完這些技巧,再來測試一下各位的打假能力吧,再來測試幾組圖片,看看你的“看圖”能力是否提高?

“假臉”橫行!這個良心網站教你如何成為“打假”專家

左邊是假的,注意頭髮光圈

“假臉”橫行!這個良心網站教你如何成為“打假”專家

右邊是假的,注意凌亂的背景

“假臉”橫行!這個良心網站教你如何成為“打假”專家

右邊是假的,注意光斑

“打假”網站從何產生?

“假臉”橫行!這個良心網站教你如何成為“打假”專家

最後,也為大家再介紹一下,這個有趣的“打假”網站是怎麼誕生的。

這個專案來自華盛頓大學的一門網紅課程“抵制狗屁——calling bullshit。授課老師分別是生物系的Carl Bergstrom和資訊學院的Jevin West。

這門課火起來部分來自這個桀驁不馴的名字,至於為什麼叫“bull shit”,課程介紹是為了抵制目前存在的各種bullshit資訊,包括公然罔顧事實和邏輯的語言、資料、圖表,以及其他呈現方式。

當然,在這個粗俗的課名之下,是非常嚴肅的課程設定。

兩位老師在課程網站的教學大綱頁面公佈了全部的課程內容和閱讀材料。感興趣的朋友可以仔細閱讀。以下我做一個簡單的介紹和分析。

教學大綱:

http://callingbullshit.org/syllabus.html

在引言部分,課程使用的是普林斯頓大學教授Harry Frankfurt的文章《On Bullshit》。其實他出版了一本書就叫《On Bullshit》。南方朔將其翻譯成了中文,在臺灣出版的時候用的書名是《放屁!名利雙收的捷徑》,在大陸出版的時候則用了非常保守的譯名《論扯淡》。

第2周引入了一些常見的分辨狗屁的方法。第3周介紹的是孕育狗屁的生態系統,比如社交媒體如何促進了狗屁的傳播。

接下來的幾周,課程從統計學和邏輯的角度切入,具體分析了一些狗屁的型別,包括混淆相關性和因果關係、中位數和平均數、“檢察官謬誤”等。課程還單獨闢出一週介紹了資料視覺化中常見的誤導。

第7周的大資料部分,關注的是在大資料和演算法的光鮮外表之下,“垃圾進、垃圾出”的現象,以及對機器學習的濫用、具備誤導性的引數等。

其後幾周深入科學研究領域,介紹了“發表偏倚(Publication bias)”、“掠奪性發表(Predatory publishing)”等概念,以及學科之內、學科之間互相批評的倫理。

第11周是關於假新聞的。內容包括假新聞的經濟驅動、迴音室效應、如何進行事實核查等等,都是新聞實驗室經常談到的內容。如果這門課開設在新聞學院,那麼這方面的內容足夠擴充套件成整整一門課了。不過因為這門課的重點放在了科學上,所以新聞方面的內容被壓縮到了一節課。

最後一週講的是如何駁斥狗屁。針對不同的受眾,需要用到不同的策略。這方面的內容基本上就是傳播學中的說服效果研究。

這門課程在2017年的春季開課,現在已經結束,老師也把課程的全部視訊放到了YouTube上,感興趣的同學開啟下面的網址進行觀看哦?

https://www.youtube.com/playlist?list=PLPnZfvKID1Sje5jWxt-4CSZD7bUI4gSPS

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2636939/,如需轉載,請註明出處,否則將追究法律責任。

相關文章