近兩年,在學術領域引起世界範圍熱切關注的,當屬2016年AlphaGo大戰李世石,以及隨後AlphaGo與柯潔的人機大戰。對這場圍棋賽事的直播、解說、討論熱度等都絲毫不亞於今日大家對世界盃的關注。
正當人們都在驚歎AlphaGo的強大,甚至柯潔本人都感嘆“AlphaGo實在太完美”的時候,人工智慧的腳步卻絲毫沒有逗留。很快,計算機可以自己作詩、畫畫、甚至寫樂譜了,而且寫出來的詩作、畫作、樂譜都被認為“挺像樣的”;越來越多的“語音助手”,被用於車載導航、電腦和手機的使用;人臉識別技術幾乎無所不在:機場、火車站、無人超市,甚至擴充套件到了豬/牛臉識別,用來判斷它們是否生病等。
除了學術界的相關研究進行的如火如荼外,各大知名企業也看到了人工智慧技術的蓬勃發展,紛紛投入大量人力物力鞏固加強自身的人工智慧技術水平。比如,FaceBook、谷歌等比以往更加頻繁的出現在學術論文作者的單位列表裡,並不斷推出讓人驚詫的新應用;BATJ紛紛成立或壯大自己的AI Lab,使自己不落伍於這人工智慧的時代!
AI時代的寵兒
在琳琅滿目的各類人工智慧技術中,有這樣一項技術,它的提出者被認為是“一個給予機器想象力的人”;這項技術被泰斗級人物Yann LeCun稱為是“近 20 年來深度學習領域誕生的最酷想法”;被《麻省理工科技評論》認為是 2018 年“全球十大突破性技術”(10 Breakthrough Technologies)之一;被美國國防部高階研究計劃局 (DefenseAdvanced Research Projects Agency,DARPA)資助因這項技術引發的一項競賽.....備受關注的這項技術就是GAN:Generative Adversarial Nets,生成式對抗網路。
2014年提出的GAN,在2016年開始受到大規模關注。它一方面將產生式模型拉回到了一直由判別式模型稱霸的AI競技場,引起了學者甚至大眾對產生式模型的研究興趣,同時也將對抗訓練從常規的遊戲競技領域引到了更一般領域,引起了從學術界到工業界的普遍關注。谷歌、Facebook、Twitter、蘋果等眾多工業界AI相關的公司也都陸續公開了許多基於GAN的相關研究成果。
那麼,這項技術可以用來做什麼呢?
GAN的典型應用
圖1的兩個視訊,一個是真實視訊,一個是改進後的GAN產生出的合成假視訊,你能分的出真假嗎?
圖1
圖2中,可以將黑白影像轉換為彩色影像、將航拍影像變成地圖形式、將白天的照片轉換為黑夜的照片、甚至可以根據物體的輪廓、邊緣資訊,來生成實體包包的形式;
圖2 GAN的部分應用示例
圖3中,可以用GAN來對人臉的某一種屬性進行單獨編輯和操作;
圖3. GAN改進版的人臉屬性編輯
圖4中列出的高清影像也都是由改進後的GAN自動生成的。這一點打破了許多人認為生成式模型GAN無法自動生成高清解析度的影像的侷限性的設想。
圖4. 高清影像生成
另外,通過GAN可以實現人臉風格轉換、影像去馬賽克、影像風格轉換等,如圖5、6、 7所示。
圖5. 影像風格轉換
圖6. 去馬賽克
圖7. 影像-藝術畫風格轉換
快速掌握GAN
對於如此強大、如此重要的技術,要想實實在在的掌握它確實不易。為了幫大家更好的學習GAN,並使用GAN, 深度學習大講堂在對GAN的發展現狀與程式碼資源進行充分分析與評估後,推出了GAN專題專項學習。
課程將從論文閱讀+程式碼復現兩個方面來進行講解和實戰演練。一方面,在論文閱讀過程中,我們將會由講師提前總結梳理每個論文的產生背景、論文中方法的提出動機、方法核心點等幾個方面進行全方位介紹;同時,另一方面,也將對程式碼實現過程進行手把手的講解,包括程式碼的準備過程、除錯訓練過程中的注意事項、實現時經常會被踩的“坑”等。
每次課上所介紹的原理方法與程式碼實現都是一個相對獨立的部分,因此,學員能更靈活的選擇其中感興趣的章節進行實現。而在整個過程中,通過原理方法與程式碼實踐兩個方面的雙重引導,進而可以使使用者在理論上、實際操作上都充分得了解這一技術——GAN。