一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

大資料文摘發表於2020-04-06

一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術大資料文摘出品

來源:Github

釋出者:yuanxiaosc

上週,又一AI偏門應用DeepNude爆出,一鍵直接“脫掉”女性的衣服,火爆全球。

應用也很容易上手,只需要給它一張照片,即可藉助神經網路技術,自動“脫掉”衣服。原理雖然理解門檻高,但是應用起來卻毫不費力,因為對於使用者來說,無需任何技術知識,一鍵即可獲取。

一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

據釋出者表示,研發團隊是個很小的團隊,相關技術顯然也還很不成熟,多數照片(尤其是低解析度照片)經過DeepNude處理後,得出的影像會有人工痕跡;而輸入卡通人物照片,得出的影像是完全扭曲的,大多數影像和低解析度影像會產生一些視覺偽像。

當然,目標“圖片”還是各種女性,較早曝光這一應用的科技媒體Motherboard表示,他們通過幾十張的照片測試,發現如果輸入《體育畫報泳裝特輯》(Sports Illustrated Swimsuit)的照片,得到的裸體照片最為逼真。一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

海外媒體Motherboard測試圖片

這一應用瞬間引發了社群的各類聲討,表示是對AI利用的反例。

連吳恩達也出面發聲,聲討這一專案。

一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

該應用在一片討伐聲中很快下線,但是,餘震猶存。

尤其是對這一應用背後技術的探討還一直在持續。

本週,一個名為“研究DeepNude使用的影像生成和影像修復相關的技術和論文“的GitHub升至一週熱榜,獲得了不少星標。

專案創始人顯然對於這一專案背後的技術很有研究,提出了其生成需要的一系列技術框架,以及哪些技術可能有更好的實現效果。文摘菌在此進行轉載,希望各位極客在滿足技術好奇心的同時,也可以正確使用自己手中的技術力量。

以下為原文內容和來源連結:

https://github.com/yuanxiaosc/DeepNude-an-Image-to-Image-technology

接下來我會開源一些image/text/random-to-image的神經網路模型,僅供學習交流之用,也歡迎分享你的技術解決方案。

Image-to-Image Demo影像到影像demo

DeepNude軟體主要使用Image Inpainting for Irregular Holes Using Partial Convolutions 中提出的Image-to-Image技術,該技術有很多其它的應用,比如把黑白的簡筆畫轉換成色彩豐富的彩圖,你可以點選下方的連結在瀏覽器中嘗試Image-to-Image技術。

https://affinelayer.com/pixsrv/

一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

在左側框中按照自己想象畫一個簡筆畫的貓,再點選pix2pix按鈕,就能輸出一個模型生成的貓。

Deep Computer Vision in DeepNude

Image Inpainting影像修復

  • 論文NVIDIA 2018 paper Image Inpainting for Irregular Holes Using Partial Convolutions and Partial Convolution based Padding.

  • 程式碼 Paper code partialconv。


一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

效果

在Image_Inpainting(NVIDIA_2018).mp4視訊中左側的操作介面,只需用工具將影像中不需要的內容簡單塗抹掉,哪怕形狀很不規則,NVIDIA的模型能夠將影像“復原”,用非常逼真的畫面填補被塗抹的空白。可謂是一鍵P圖,而且“毫無ps痕跡”。該研究來自Nvidia的Guilin Liu等人的團隊,他們釋出了一種可以編輯影像或重建已損壞影像的深度學習方法,即使影像穿了個洞或丟失了畫素。這是目前2018 state-of-the-art的方法。

Pix2Pix(need for paired train data)

DeepNude mainly uses this Pix2Pix technology.

  • 論文 Berkeley 2017 paper Image-to-Image Translation with Conditional Adversarial Networks.

  • 主頁 homepage Image-to-Image Translation with Conditional Adversarial Nets

  • 程式碼code pix2pix

  • Run in Google Colab pix2pix.ipynb

一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

Image-to-Image Translation with Conditional Adversarial Networks是伯克利大學研究提出的使用條件對抗網路作為影像到影像轉換問題的通用解決方案。

CycleGAN(without the need for paired train data)

  • 論文:Berkeley 2017 paper Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

  • 程式碼:code CycleGAN

  • Run in Google Colab cyclegan.ipynb

一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

效果

CycleGAN使用迴圈一致性損失函式來實現訓練,而無需配對資料。換句話說,它可以從一個域轉換到另一個域,而無需在源域和目標域之間進行一對一對映。這開啟了執行許多有趣任務的可能性,例如照片增強,影像著色,樣式傳輸等。您只需要源和目標資料集。

未來

可能不需要Image-to-Image。我們可以使用GAN直接從隨機值生成影像或從文字生成影像。

Obj-GAN

微軟人工智慧研究院(Microsoft Research AI)開發的新AI技術Obj-GAN可以理解自然語言描述、繪製草圖、合成影像,然後根據草圖框架和文字提供的個別單詞細化細節。換句話說,這個網路可以根據描述日常場景的文字描述生成同樣場景的影像。

一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

效果


一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

模型

StoryGAN

進階版神筆:只需一句話、一個故事,即可生成畫面

微軟新研究提出新型GAN——ObjGAN,可根據文字描述生成複雜場景。他們還提出另一個可以畫故事的GAN——StoryGAN,輸入一個故事的文字,即可輸出「連環畫」。

當前最優的文字到影像生成模型可以基於單句描述生成逼真的鳥類影像。然而,文字到影像生成器遠遠不止僅對一個句子生成單個影像。給定一個多句段落,生成一系列影像,每個影像對應一個句子,完整地視覺化整個故事。

一鍵“脫”衣應用DeepNude迅速下線,來看看它涉及的影像修復技術

效果

現在用得最多的Image-to-Image技術應該就是美顏APP了,所以我們為什麼不開發一個更加智慧的美顏相機呢

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2649330/,如需轉載,請註明出處,否則將追究法律責任。

相關文章