Deepfake的興起,讓視訊和音訊不再是記錄歷史的可靠證據!近日一則電影片段在YouTube爆火,影片中兩位主演分別是好萊塢兩位頂級流量巨星西爾維斯特·史泰龍(Sylvester Stallone)和阿諾·施瓦辛格(Arnold Schwarzenegger)
::__IHACKLOG_REMOTE_IMAGE_AUTODOWN_BLOCK__::0
然而,短片爆火的原因不是兩位巨星,而是它逼真的視訊合成效果。
事實上,這部名為《Step Brothers》的電影主演是兩位小眾演員,短片創作者利用Deepfake將面部替換成了兩位巨型。
短片中,人臉自然、毫無痕跡的融合效果,讓不少網友們驚歎:太恐怖。
但事實上,更讓人恐怖的是短片背後,Deepfake愈演愈烈的負面應用。自2017年,某Reddit使用者首次將其用來偽造色情視訊開始,Deepfake造假已逐漸滲透到政治、媒體等多個領域,甚至還威脅到了今年的美國總統大選。
與此同時,偽造品的數量也在逐年增長,特別是在2020年再次創下歷史新高,達到49081個。
那麼,快速增長的Deepfake有哪些特點,背後有哪些應對措施?
Deepfake氾濫成災,增長率超330%
近些年,計算機視覺技術得到飛速發展。
尤其是2014年生成式對抗網路GAN的提出,讓影像和視訊合成不斷取得驚人的效果。
2017年,這項技術被不良分子用來偽造了一段色情視訊,由此該技術被人們稱為“Deepfake”,後來Deepfake的負面應用不斷髮酵,並逐漸覆蓋到更廣泛的影像、視訊,乃至音訊領域。
具體來說,Deepfake主要是對人臉進行篡改和重新編輯,包括表情修改,換臉、換口型、合成新人臉四種模式。其中,換臉和對口型是Deepfake最主要的應用模式,其破壞性和殺傷力也最強。如篡改政客公開演講以及偽造色情視訊。
值得注意的是,造假者無需瞭解這些修改模式背後的技術原理,諸多開源軟體,已經可以讓他們輕鬆地製造虛假內容。比如DeepFaceLab之類的工具,任何人都可以拍攝一張圖片或視訊,並替換或操縱人臉。
技術的普及和便捷性,讓造假品數量成指數級增長。根據安全分析公司Sensity最新結果顯示,
自2018年12月以來,Deepfake線上造假品的數量大約每六個月翻一番。
2019年7月Deepfake的總數達到14,678,相比於2018年12月的7964部造假視訊增加了近100%。而截至今年6月,造假視訊已多達49081個,比2019年7月增長了330%以上。
色情視訊佔比最高,美英成重災區
2019年,在14678個公開發布的Deepfakes作品中,假色情視訊佔據了96%。
另外,根據Sensity調查分析顯示,Deepfake用來製作色情作品的目標物件超過95%全部來自影視娛樂業,只有剩下的一小部分來自商業、新聞媒體以及政治領域。
而今年,影視娛樂仍然是覆蓋最廣的行業,佔據了62.7%,加上時尚類別(21.7%)和運動類別(4.4%),總計佔所有目標的88.9%。
其中,在娛樂行業62.7%的佔比中,來自Instagram,Twitch以及Youtube等社交媒體的目標物件數量顯著增加。同時,來自商業(4.1%)和政治(4%)背景的目標物件也有所增加。
值得注意的是,上述4%政治背景的目標物件,主要集中在一些知名政客身上,如川普、奧巴馬等。資訊時代,利用這些政客身份偽造虛假政治言論,可能會造成災難性成果。
尤其是隨著技術的提升,偽造品越來越難以用肉眼分辨。去年,一名馬來西亞政治家就因涉嫌從事同性戀活動的視訊而被判入獄(在馬來西亞同性戀是非法的),但後來證實該視訊是Deepfake偽造的。
另外,比利時政治團體也曾利用Deepfake偽造了一段川普關於巴黎氣候協定的演講視訊,在當時產生了不小的轟動。
不過,總體來看,大部分有關政客的虛假作品還多以諷刺為目的。
另外,這些虛假作品有明顯的地區分別特點。從Sensity的統計結果來看,政客偽造品主要集中在西方國家,尤其是美國和英國。同時,韓國和印度在今年也成為了主要目標。
圖中,美國和英國在整體中佔據了61%,超過了一半。韓國(9.6%),印度(5.0)和日本(4.0)也構成了很大一部分。總體來看,說明亞洲的政治造假活動在持續增長。
反Deepfake技術有哪些?
Deepfake的危害無需再多說。
為了應對日益氾濫的偽造品,學、政界和各大企業也在聯合發力,研發反Deepfake技術。
值得一提的是,Kaggle和Facebook已經舉辦了多場Deepfake探測器研發競賽,並收集了大量用於訓練的資料集。
Deepfake檢測器,主要通過對大量影像和視訊進行訓練,並從中查詢不同的Deepfake識別符號來鑑別內容真偽。目前最先進的監測手段,分為以下幾種:
- 人臉X射線( Face X-ray)檢測:它是一種將假臉重新混入目標影像或視訊,以從中尋找邊界的方法。經過FaceForensics 資料集上測試,精準度可達99%以上。(https://arxiv.org/abs/1912.13458)
- 背景差異檢測:該方法通過將人臉區域與背景區域進行對比,從中尋找微小差異以辨別真假。(https://arxiv.org/pdf/2008.12262.pdf)
- 情緒識別網路(Emotion Recognition Network):該方法通過檢測面部情緒是否與場景上下文或音訊內容相匹配,來確定視訊是真是偽。(https://arxiv.org/abs/2003.06711)
- 生物學訊號:通過檢測視訊目標的心跳並分析該訊號的殘差確定真假,該方法的準確率已達到97.29%,同時還可以檢測背後所用的Deepfake模型。(https://arxiv.org/pdf/2008.11363.pdf)
以上大多數這些Deepfake檢測方法都沒有可用的開原始碼,不過,目前也有一些商業上可用的API,例如Sensity,Deepware,以及微軟的 Video Authenticator。
此外,要說明的是,雖然人臉X射線檢測法精度已經達到99%,但它僅限於FaceForensics資料集,對於“Wild”資料集可能並不適用,很多其他檢測工具也是如此。
一位研究人員證實說,他上述某款模型用於《Step Brothers》和川普偽造視訊檢測,結果並不能證偽。儘管川普的偽造視訊有明顯的缺陷(嘴邊周圍有合成痕跡)
因此,在特定Deepfake檢測資料集上表現良好的模型,在現實世界中也不一定達到理想效果。
但慶幸的是,高質量的Deepfake造假品仍需要人工干預來完善輸出,這會極大地減慢傳播速度,併為改進Deepfake檢測模型提供時間。
自 cnbeta