用GAN創作似乎已經不是新鮮事了。
2019,英偉達在GTC大會上推出了一個人工智慧影像生成器“GauGAN”。使用者只需要簡單的勾畫幾條線條輪廓,便會自動生成美麗的風景圖片。
這款AI使用的技術是生成對抗網路(GAN),也是一種深度學習模型,現在被廣泛用於影像生成。
包括去年MIT和IBM沃森聯合實驗室聯合釋出的AI Portraits Ars,使用者可以線上將自己的照片轉變為中世紀的最佳化風格,這個線上工具一度火爆到網站當機。
你可能會說,“這不就是風格遷移麼?”
不,團隊人員專門強調,這不是風格遷移,這是AI自己創作的,從線條到色調,都和人類畫師一樣,照著真人的樣子自行創作。
但是正如東西方巨大的文化溝壑一樣,在藝術和技術結合的領域,AI似乎也更偏向西方,我們看到不少AI生成寫實主義、後現代,甚至是抽象主義的作品,但是卻很少能看到AI在傳統東方藝術上的表現。
終於,一位普林斯頓大學的本科學生Alice Xue將目光投向了中國山水畫。
在她的畢業論文中,她開發了一款名為SAPGAN(Sketch-And-Paint GAN)的AI模型,該模型可以生成傳統的中國山水畫,為此她也獲得了普林斯頓2020優秀畢業論文獎。
論文連結:
https://arxiv.org/pdf/2011.05552.pdf
論文提到,在一項242人的圖靈視覺測試研究表明,SAPGAN創作出的畫作被誤認為人類藝術品的頻率高達55%,顯著高於基線GAN模型創作的畫作。
傳統中國山水畫在繪製過程中,一般有勾、皴、點、染等步驟,顧名思義,就是先勾畫出大致輪廓,再進行渲染。
AIice提出的端到端生成中國山水畫無條件輸入模型遵循的也是這個步驟。為了實現這一過程,AIice構建了兩個模型:
SketchGAN從樣本影像中採集高解析度的邊緣圖,而PaintGAN是根據SketchGAN進行“翻譯”創作,從而生成一幅完整的山水畫。在最後進行測評時,242名參與者中,模型生成的畫有一半以上(55%)被誤認為是人類作品。視覺圖靈測試的分數分佈,要求參與者判斷藝術品是由人類還是計算機制作的(平均值= 70.5%)在“審美愉悅”、“藝術構圖”、“清晰”和“創造力”方面,SAPGAN模型在所有藝術類別中的評分始終高於基線。SAPGAN與人類繪畫最大的區別是“清晰”。讓人匪夷所思的是,中國人可能更容易被SAPGAN欺騙。作為母語為漢語的人,多少是見過幾幅山水畫的,但是在判別一幅山水畫是否為SAPGAN所作時,中國人可能更容易被欺騙。作者比較了母語為漢語和英語的參與者的結果,看看文化接觸是否能讓中國參與者正確判斷這些畫。然而,說漢語的參與者平均得分為49.2%,明顯低於說英語的考生的73.5%。也就是說,說中文的人70%的時候還會把SAPGAN的畫誤認為是人,而整體水平是55%。顯然,不管對中國文化的熟悉程度如何,參與者都很難區分繪畫的來源。文章提出的模型是在一個新的中國傳統山水畫資料集上訓練的,這一資料集不是來自百度或者谷歌,而是由作者本人收集。AIice表示,目前的山水畫資料集存在不唯一性和影像質量和數量不足的問題,為了促進這一領域的發展,Alice本人建立了2192幅高質量中國傳統山水畫組成的新資料集,這些山水畫來自普林斯頓藝術博物館藏品。目前,這些有價值的繪畫在很大程度上還沒有被生成創作研究觸及,作者也在GitHub上釋出了這一資料集供公眾使用。Alice在接受學校採訪時說,普林斯頓大學美術館有一個令人驚異的開放式數字收藏中國畫,這對我的資料集很有價值,但不幸的是,大多數研究人員沒有充分利用它。https://github.com/Alice x 2020/Chinese-landscape painting-Dataset寫論文之前從沒上過機器學習課,準備去Facebook工作看到這裡,你可能覺得Alice是一位“資深程式設計師”了。但是她表示,“我寫這篇論文的時候從來沒有上過機器學習課程,所以我經常被這樣一個問題弄得不知所措: 像我這樣的新手能為已經存在的創新研究做些什麼。但是我發現總是有一個有趣的角度來處理一個問題,因為一個人的興趣和技能是他們獨一無二的。”在談到對其他的學生建議時,Alice說,將數字化人文融入你的工作中是自然而然的事。找到你感興趣的東西——無論是19世紀的文學作品還是爵士樂——總有一種方法可以從中收集資料,用來分析或製作與之相關的技術工具。談到自己未來的規劃,Alice表示自己準備去Facebook工作,成為一名軟體工程師。