【雜談】GAN最成功的3個商業化落地領域,你是否瞭解過?

喜歡打醬油的老鳥發表於2020-10-14

2015年的時候筆者開始關注GAN,公眾號早期的文章中就有GAN的綜述,這些年GAN的相關研究也是持續井噴。這一次我們們學術上的研究撇開不講,這麼多年過去了,GAN有哪些最成功的商業化落地領域?

影像生成與編輯領域

GAN的誕生之初,就是做資料生成,如今在一些領域可以說是非常的成熟了,其中尤其是StyleGAN為代表的高清人臉生成領域。

StyleGAN結合獨創的mapping network和在影像風格化領域中通用的AdaIN技術,將人臉特徵進行了分層表達,其生成結果已經達到了普通使用者難以辨認的水平,如下圖展示了一些高清樣本(1024×1024解析度)。

從影像生成到影像編輯其實是很自然的過渡,比如我們可以將StyleGAN應用於人臉表情,年齡等屬性編輯,也可以採用其他類似框架,之前介紹過的爆款應用FaceAPP中有非常好的實現。

【AI產品】一鍵時光穿梭表情互動,這款FaceApp你知否​mp.weixin.qq.com

 

另外在人臉演算法領域中,大家最熟悉的莫過於換臉演算法Deepfake。

通過公用的編碼器和專用的解碼器,即實現了人臉身份的編輯,下面的這張朱茵換臉成楊冪的圖相信大家都很熟悉了。

後來一度大火的ZAO應用大部分同學也不會忘記,如今在國外依舊有一些換臉APP可以正常使用。

除了人臉,人體的編輯也是當下的熱點,從換臉演算法到換衣演算法,只是一個資料和模型迭代的時間週期問題了。

影像增強領域

由於GAN擅長於建模資料分佈,因此在影像增強領域中應用非常廣泛,包含影像降噪,超分辨,去模糊,影像修復等。

我們以前給大家介紹過一款影像質量增強APP,名為‘你我當年’,可以非常好地恢復低清影像的解析度,去除噪聲。

【AI產品】你我當年的老照片,如今修復了可還行?​mp.weixin.qq.com圖示

下圖展示了一些對比圖。

背後自然是少不了GAN模型的功勞,其中SRGAN等就是比較典型的代表。另外,在影像的美學增強,影像修復等領域中技術發展也非常迅速,相信不久後就會出現新的爆款應用。

風格化與內容創作領域

風格遷移由於具有非常好的娛樂性,從《A Neural Algorithm of Artistic Style》研究開始,成為了一個很活躍的領域。早期的時候誕生過爆款應用Prisma,後來出現了一系列的影像和視訊濾鏡。

隨著GAN技術的成熟,風格遷移領域發展地更加成熟了,一方面,可以實現更加精細可控的風格控制,比如前段時間抖音的人臉漫畫特效。

<br> (二維碼自動識別)

另外一方面,不僅僅可以創造油畫等風格,其應用還可以擴充到很多內容創作領域,典型的如黑白圖上色,線稿上色等。

如何持續學習GAN

作為一項基礎技術,GAN的應用當然不止這些,有三AI生態有許多內容可以供大家學習,下面給大家彙總相關資源。

(1) 技術文章。

從理論到實踐,我們公眾號寫過非常多的GAN相關的技術文章,下面是一個彙總,供大家學習。

【完結】12篇GAN的優化文章大盤點,濃濃的數學味兒

【技術綜述】有三說GANs(上

【模型解讀】歷數GAN的5大基本結構

【百戰GAN】二次元宅們,給自己做一個專屬動漫頭像可好!

【百戰GAN】羨慕別人的美妝?那就用GAN複製貼上過來

【百戰GAN】如何使用GAN拯救你的低解析度老照

【百戰GAN】GAN也可以拿來做影像分割,看起來效果還不錯?

【百戰GAN】新手如何開始你的第一個生成對抗網路(GAN)任務

【雜談】除了生成影像(造假),GAN如何給目標檢測,影像分割,影像增強等問題打輔助?

【雜談】那些底層的影像處理問題中,GAN能有什麼作為?

【雜談】GAN對人臉影像演算法產生了哪些影響?

相關文章