最新訪談首次披露拍出「天價」AI畫作背後的故事

机器之心發表於2018-11-04

圍繞新技術將有更多可能性。將會有越來越多的工具被創造出來,將會創造出新的藝術家,新的藝術作品和新的使用這些工具的藝術方法。不過,將人從藝術中剔除出去,毫無意義。

不久前,拍賣行佳士得在一家大型拍賣場以 43.25 萬美元(約合人民幣300萬)的高價拍出一件人工智慧藝術品。這幅作品是由來自法國藝術團隊「Obvious」,團隊主要成員是三名25歲的青年,他們沒有接受過正式的藝術培訓。 最新訪談首次披露拍出「天價」AI畫作背後的故事左圖:《埃德蒙·貝拉米(Edmond Belamy)的肖像》在佳士得以432,500美元的價格拍賣;右圖:湯姆·懷特基於羅比·巴拉特 (Robbie Barrat )的2017 art-DCGAN 平臺生成的作品。

外界對於在這幅AI天價作品的創作過程有著諸多疑惑——人工智慧藝術家羅比·巴拉特(Robbie Barrat)的作品值得稱讚嗎?為什麼「Obvious」誇大了演算法的作用?「Obvious」 真的表示在考慮為他們的演算法申請專利嗎?在創作愛德蒙·貝拉米肖像的過程中,Obvious 扮演了什麼角色?在「Obvious」看來,人工智慧和藝術是如何一同向前發展的?

在這篇採訪中,我採訪了 Obvious 的技術負責人 Hugo Caselles-Dupre。我向他提出了上述問題,直接得到最真實的答案。我相信 Hugo 在這次採訪中是坦誠而透明的(即使可能為他帶來一些麻煩)。

我對 Hugo 的採訪是全方位的,他在採訪中也給出了他未經過濾的觀點。因為我已經給了 Hugo 超過 6800 字了,在我們深入介紹採訪內容之前,我想分享一些來自人工智慧藝術社群的其他成員的想法,來為這個故事提供一些平衡。

最新訪談首次披露拍出「天價」AI畫作背後的故事Mario Klingemann用 生成性對抗網路創作的畫作

我採訪了受人尊敬的人工智慧藝術家 Mario Klingemann,他創作了《埃德蒙·貝拉米(Edmond Belamy)的肖像》,令人讚歎。他向我們分享道: 

「這件作品的成功應該歸功於什麼,誰也不容易回答。

這裡有一個重要因素,這項工作是在藝術背景而不是在科學的背景下創造出來的,所以,沒有必要像科學研究一樣引用以前的工作或列出創造的工具和框架。

說到 Ian Goodfellow 的生成性對抗網路(Generative Adversarial Network,GAN),我認為這是一種生產工具,類似於數碼藝術中的 Photoshop 或繪畫中的畫筆。

據我所知,Ian 並不是一個藝術家,也沒有將他創造的 GAN 當做藝術作品,因此, 我認為在某份作品中提及他或其它研究人員的工作是合乎禮貌的,但是我也並不認為因為在創作過程中使用了他的技術,就需要將他稱讚為藝術家」。

「但在 Robbie 的工作中,情況就不同了:他策劃了訓練資料集,訓練了模型,並把它放到了 GitHub 上。最後,Obvious 可以直接使用這個模型,讓它根據隨機特徵向量生成一些影像,最後從中選出他們想要的藝術品。

所以,你可以說 Robbie 完成了這個過程中三分之二的工作。

最新訪談首次披露拍出「天價」AI畫作背後的故事湯姆·懷特基於羅比·巴拉特(Robbie Barrat)的 2017 art-DCGAN 平臺生成的作品

另一位備受尊敬的藝術家 Tom White 自上世紀 90 年代中期以來一直在探索人工智慧和藝術。他認為, Obvious 使用了類似的程式碼庫和相同的訓練集。

事實上,Tom 親自執行過 Robbie 的模型,並能做出幾乎和愛德蒙·貝拉米的肖像一模一樣的影像。他認為「愛德蒙·貝拉米畫像」是一部「借鑑」而來的作品。

Hugo 關於這方面的想法在下面的採訪中有詳細的介紹。他特別要求我把這段影片作為部分證據,證明 Obvious 的確訓練了他們自己的 GAN。

接下來,我們進入第二部分,亦即我與  Hugo Caselles-Dupre 的對話。(JB=Jason Bailey;HC=Hugo Caselles-Dupre;JB=Robbie Barrat。)

Robbie Barrat 應該為其創作的 Edmond Belamy 的肖像受到稱讚嗎? 

JB:我可能要問一些難以回答的問題,但我認為這很重要,因為我知道你想透過這次採訪來消除一些誤會。Robbie Barrat 在你做創造的作品中做出了一定貢獻,你認為他因此應該受到讚揚嗎?或者你會說,他不過造了相機,而使用相機的是你?你對此有何看法?

HC:是的。我認為這是個好問題。我們也經常問自己這個問題。我們會想,「好吧,我們能做些什麼呢」?但最終,事實是我們做出了這件作品,並形式化定義了這個問題,這就是我們想要做的事情。

我認為,在我們專案向外界展示的過程中,他也承擔了很多責任。所以,我們欠他很多,這就是我們想對他說的,我們想和與他建立好的合作關係。所以我們欠他很多。我們祝他成功。

我們希望,如果人們喜歡我們的專案,他們也會去看他的專案,看看他在做什麼。所以,我們認為在這種情況下,他應該得到一些回報。然後,我考慮更多。我們到底能做什麼? 

JB:這些問題只是為了將事情說清楚,而這次採訪正是我們做這件事的最佳時機,我們的訪談將會深入一些:你能在不使用 Robbie 的程式碼的情況下完成 Belamy 專案嗎? 

HC:是的,我確實是這麼認為的,因為我們同時關注很多不同的資料集。

我們已經知道我們想要做的是一些類似古典藝術的工作,像肖像畫之類的。這個想法我們已經思考成熟了。因此,當我們看到 Robbie 的工作的時候,我們就想「好吧,這真的很方便,所以我們可以試著用它。」

是的,我們肯定會自己找到一種方法。在檢視他的程式碼之前,我在碩士階段已經做了很多與 GAN 相關的工作。這只是收集資料集的問題,由於我們具備抓取資料的能力,我們總能找到一種方法。

我們主要用他的程式碼來完成 scraper 網路爬蟲的資料抓取工作,從而獲得所有的藝術作品資料。最後,建立 Belamy 集合所使用的程式碼是我曾經提到過的 GAN 置換技術。

JB:是 PyTorch DCGAN 嗎?

HC:我曾在攻讀碩士期間進行了這項工作,我對 GAN 程式設計十分熟悉。

JB:大多數情況下你都會使用 scraper 收集圖片資料嗎?

HC:是的,我會用它收集資料。這是一個 Python 指令碼,當你執行它時,它會收集所有的資料(比如肖像類的資料)。你可以透過它收集所有的肖像資料。

JB:你從哪裡得到的這些影像?

HC:在 Wikiart.com。

為什麼你說「不僅僅是人類才具備創造力」?這是否意味著人工智慧能自主完成工作,即使你知道事實並非如此? 

JB:你怎麼看「不僅僅是人類才具備創造力」這一說法?你是不是高估了機器,現在又說那不是你的意思? 

HC:是的。完全正確。

我想這就是當你在做某件事卻沒人關心的時候會發生的事情,然後你就會變得很茫然,做出一些非常蠢的事情。

當每個人都有這樣的觀點時,他們就會回到你之前做過的事情上然後你就必須證明它是正確的。我們一直在證明這一點,因為我們仍然認為建立影像的 GAN 運算子的這一部分非常有趣,而且存在某種形式的創造力……我們只是覺得這樣做很酷。對我們來說,這只是一種有趣的說法。

JB:你之前想過你們的事件會被放在顯微鏡下被放大嗎?

HC:如果我們知道將會有 400 篇關於我們工作的新聞報導,我們肯定會這麼做。但在那一刻,我們就想,『是啊,這太愚蠢了,好吧,不管怎樣,讓我們把這個放上去。』

但回顧過去,當我們看到這種情況時,我們就會說,這是一個大錯誤。你所能做的就是承認錯誤。

GANS展示了什麼創造性行為? 許多人覺得他們沒有表現出創造性的行為。

HC:對於我來說,如果你能給它一定數量的資料示例,那麼你就可以繼續看到潛在空間中的生成結果,對我來說,這種差距需要被填補。所以,一定有某種類似發明創造這樣的事情。所以我想我有一些創造力。

因為創造力是一個非常寬泛的術語,所以它可能會被誤解,因為創造力是與人類相關的東西。但在基本的,低層次上,它被賦予了一組影像,它可以建立不屬於訓練集的影像,這是一些被模型轉換的東西,有某種創造性。所以這只是你理解「創造力」這個詞的一種方式。也許從某些角度你可以說這是創造力。

JC:聽起來你認為這取決於你對創造力的個人定義? 有人說,GANs 只是近似分佈,這並不是真正的創造性,但聽起來你覺得它是創造性的? 

HC:是的。這就像,無論你認為創造力是什麼,如果我們符合同樣的定義,我們就不得不在某些事情上達成一致。如果我們用同樣的定義來定義創造力,比如說,這個概念,那麼 GANs 就會符合這個概念。或不呢? 我想,這只是一種觀點——我理解人們會說 (這) 不太好,我們理解,但這只是一種觀點。

你是否聲稱你要為這個演算法申請專利,即使它不是你的? 

JB:所以有一篇文章引用了你的話,說你決定不為你的演算法申請專利。你跟我說過你從來沒這樣說過。但是在你們的畫作前署名 Ian Goodfellow,所以你不認為這是一種申明著作權的表現?

HC:是的。「Belamy」在法語中被翻譯成「Goodfellow」。所以我認為這個論點真的不好,因為我們說了很多次「Belamy」是法語中「Goodfellow」的翻譯,因為我們欽佩 Goodfellow,他創造了GANs,所以我們把公式寫在這裡。

這是一個數學表示式,不是我們的,不是他的。它不屬於任何人。這和 GANs 很像,但我們尊重 Goodfellow 因為他創造了這篇論文,但它是開源的。所以,我們從沒想過要對 GAN 演算法進行版權保護。這說不通。

因為對我來說,作為一個機器學習的研究者,這樣想是很荒謬的,因為,你不能給一個定理或演算法申請專利因為它是人類常識的一部分,任何人都可以自己呼叫它並使用它。這是常識的一部分。

是的。文章中有越來越多我們從未說過的話。

在建立 Edmond Belamy 肖像時,Obvious 做了哪些貢獻?

JB:那麼是別人寫了你用的 GAN 程式碼,對吧? 你用 DCGAN 來畫 Belamy 了? 

HC:是的。完全正確。我們使用了 DCGAN。這是 PyTorch 中可用的實現,它存在於 Soumith Chintala 程式程式碼庫 ,所以我們使用它是因為我們嘗試了兩個變體,因為在我的研究中,我已經編寫過許多不同型別 GAN 的程式碼,所以我已經有了程式碼。

最後,當我做了全面研究後,我認為 DCGAN 沒問題。這與技術效能無關;我們只是說,『嘿,這就是使用 GANs 的新方法。「我想像 GANs 一樣的東西,對人工智慧藝術來說很有趣,但它也是研究。」

比如,GANs 進行了真正的技術創新,而我們並沒有宣稱要做這樣的事情。我們只是想有正常的 GANs 工作良好,並允許我們做想做的。

因為現在我們正在利用 3D GAN 做一個的專案,我想這次的技術創新會更大。我們正在與 Max Planck 研究所的一些研究人員聯絡,希望使用他們的一種模型來創造和訓練 GAN。

在這個專案中,我認為我們越來越多地參與到它的工作中來。但因為這是我們的第一個專案,使我們工作的起點。這似乎是個合理的主意。這個專案看起來不錯。我們嘗試了很多超解析度演算法,所以最後我們嘗試了 GAN,我們也嘗試了其他不使用機器學習技術的更傳統的演算法。最後,我們找到了一種提高效能的方法,其效果非常好,能得到很漂亮的結果,我們覺得這很酷,我們會堅持做下」。

是的,我們只是嘗試了很多模型,當我們認為模型的結果對於我們的第一個專案來說已經足夠好時,我們說「好了,現在讓我們試著向世界展示它」,也許我們可以透過它為我們進一步的研究籌集資金,看看我們可以透過它做些什麼。因為我們的第一想法是「好吧,讓我們試一試吧」。

如果我們設法表達一些意見,同時人們對我們感興趣,我們就可以啟動新的專案,然後我們繼續沿著這個新專案做下去。如果沒人關心,我們就會停止工作,然後我的兩個朋友打算回去工作,我們就會停止,繼續我們的生活——我有博士學位,他們有工作——我們繼續我們的生活。

但是,爆炸性的事實真的改變了一切。我想,是的,一個很大的誤解是,這只是我們的第一個專案,所以我們想做這個。

JB:與我一起工作過的一些工程師會認為這是一種現成的技術。你們的工作沒有太多的技術革新。如果沒有技術性的創新,那麼 Belamy 專案的創新點在哪裡? 

HC:所以對於這個專案,我們猜測它的創新點是……我們以一種簡單而不是精密的方式展示了它因為它真的很容易理解,我認為這就是創新

但既然它已經引起了如此多人的共鳴,那麼這裡肯定有一些與前人不同的東西。一開始,我們想做一些原創的,獨特的事情。但你無法真正控制人們對你所做事情的看法。所以是的,也許它真的是可以實現的才是關鍵。

但我們真的不知道創新究竟有多大。所以對於進一步的專案,我們有很多思考。但還有一件事必須認真考慮,那就是我們沒有錢。

我們沒有計算能力, 所以我們在這第一個專案上花了很多錢進行嘗試,當我們覺得我們的結果已經足夠好,我們就會停下來,因為繼續研究下去會耗費我們大量的金錢和時間,我們真的不能負擔得起這樣的創新。因為如果你沒有計算能力,你就不能做出一些創新的成果。

當然,我從他們在 Reddit 上釋出的那天起就知道了「progressive GAN」,我想在第二天嘗試一下,但我就是做不到。這和大的 GAN 論文是一樣的,比如說它需要 512 個 GPU 核心(這是我們沒有的),而我們沒有這麼多預算。

所以現在,如果你想訓練這個模型,你就無法做到。所以,是的,我們想要做一些創新的事情,但是我們必須從某個小專案開始獲得一些資金並繼續工作,我們慢慢積累一些信譽,才能有機會獲得更多的計算能力。

這是做出真正創新的事情的一種曲線救國的思路

在我們創作 Belamy Family 的時候,我們沒有辦法去做一些真正有創意的事情——或者,我認為創意不夠。嘗試真正的創新對我們來說是非常困難的,因為我看到在我的研究中, 做出真正的創新需要經歷無數次的嘗試和失敗。如果你失敗了, 你對模型的訓練就沒有意義了,然後你必須為此付出金錢和時間。

所以,我們負擔不起。

你為什麼沒有開源自己的程式碼呢?

JB:還有一些簡短的小問題。我讓一些人知道我在採訪你,問他們有什麼問題。有人問,如果你真的想讓公眾明白這一點,為什麼不開放原始碼? 

HC:是啊,好吧,為什麼不呢?實際上我們可以做到,但我認為它已經是開源的了。就像我說的,我們用的是 DCGAN,是的,它已經上線了。但如果有人感興趣的話,我們可以這麼做。

但我們主要是想指出,我們使用的不同技術,這些技術也在我們的 Medium 部落格中實現了。這就是 DCGAN PyTorch 程式碼倉庫。我們還受到了 Robbie Barrat 的 art-DCGAN 程式碼倉庫的啟發。我們可以釋出這些資料集,但是這沒什麼意思。我們只是去掉了所有有雙面的畫或者像真的肖像畫的畫。但我們並不反對開源。

對我來說,開源的過程就是獲取別人的程式碼然後開源,就好比它不是你的,只要指出你從哪裡得到這些程式碼,而我在 Robbie Barrat 的 GitHub 和 Sumith 的 GitHub 上得到了這些程式碼。你可以用它。這些工具已經可用了。

JB:所以開源意味著你獲得了比你想要獲得的更多的榮譽,因為你實際上沒有寫任何程式碼? 

HC:是啊,我想你說得很有道理。如果我站在 Robbie Barrat 的立場上,我就不希望看到我的程式碼被用在 Obvious 公司釋出的任何東西上,因為這是我的程式碼。

我們已經和很多記者談論過他,說我們受到他所做的事情的啟發,在我們的主要部落格文章中,你可以訪問他的 GitHub 的連結。這是我們討論的第一件事。前面, 我們還真的跟他有所交流。

比如, 當我們這樣做時, 討論過我們是否需要給他留言, 問他這樣做是否可行。他告訴我們, 他沒有意見, 他告訴我們「好吧, 我以為你只用程式碼而不是訓練模型」。然後我們說,「不,不,我們訓練了我們自己的模型。我們調整了超引數使其工作」。我們玩得很開心,最後,他說一切沒問題。他讓我們引用他的程式碼,我們在網站上就是這麼做的。

我們真的不想偷他的想法,也不想偷他的程式碼,我們想對他保持誠信。

GAN 從此會走向何方?

JB:看得出你對藝術有一些熱情,你如何看待人工智慧和藝術的關係?人工智慧給藝術帶來了了什麼,誰在創作有趣的作品,你如看待它相對於更大的藝術領域的關係以及你對它的熱情? 

HC:我認為我們被這麼頻繁地曝光的原因之一是人工智慧藝術揭示了人們對人工智慧的看法,揭示了人們對人工智慧的恐懼和誤解。這就是為什麼它也得到了如此多的關注。

所以在藝術領域,我想說這真的很有趣,因為它展示了這個社會的一些東西,因此,我認為藝術是一種很好的方式來揭示社會的情緒和人們現在的想法。

所以這確實代表了目前與人工智慧相關的行業的氛圍以及所有的誤解。我認為這也是人工智慧藝術有趣的原因之一,因為它展示了今天人類的一些東西。

我看到 GAN 是在 2014 年被提出的,(而且) 第一個結果並不是很好。現在,每隔 6 個月,我們就會在技術上有一個很大的飛躍,所以我們看到了各種各樣的 GAN 的變體,然後我們得到了 DCGAN、我們得到了 Progressive GAN、我們得到了 big GAN 而這是第一個得到了逼真的臉的結果的模型。

Progressive GAN 是一次巨大的技術飛躍。我認為,Big GAN 也是一個巨大的飛躍,因為影像的多樣性非常大。所以從技術的角度來看,由於研究人員的速度非常快,我認為圍繞這項技術將會有越來越多的可能性

不僅僅是 GAN,因為 GAN 是一個巨大的例子,現在顯得非常有趣,但是我們不會對人工智慧研究感興趣,由於人們在人工智慧研究上投入了大量的精力,將來會有更多的突破。所以,我認為將會有越來越多的工具被創造出來,那將會創造出新的藝術家,新的藝術作品和新的使用這些工具的藝術方法

我們真的認為這個工具不可思議。當我們說到攝影的時候,我們的意思是,當攝影第一次出現的時候,它對於高階工程師來說就是一種工具,而我們現在不過是有了同樣的人工智慧工具。也許人工智慧會像攝影一樣引發一場全新的藝術運動。所以我們希望是這樣,但我們不能確定這一點。我不知道它是否會像攝影一樣長久,是否會像攝影一樣重要,但我認為這是一個很好的機會。

JB:我看到了一些類似谷歌 Deep Dream 的東西,一旦程式碼成為開源,任何人都可以新增照片。當我新增照片時,一開始我很驚訝,我想,「這比 Salvador Dali 好」,但在新增了 10 張照片之後,它就失去了新鮮感。所以再也沒有人對 Deep Dream 影像感到興奮了,因為他們意識到即使是他們的祖母也可以透過點選按鈕來實現。那麼, GAN 與 Deep Dream 有何不同? 

HC:我明白你的意思了。我想在這裡我們可以把它和攝影相比較。

任何人都可以拿著他們的手機去拍任何東西。那麼,是什麼讓攝影變得如此不可思議或者如此有趣呢? 所以我認為,就像在攝影中一樣,你必須新增一些技巧,這些技巧會被你的工具以及傳達的資訊放大。

當你看到艾未未的照片和他的中指之類的東西時,你會發現,任何人都可以做這樣的攝影,但是他的攝影方式是非常相關的,並且帶有強烈的資訊。這就是為什麼它很重要。

我認為隨著時間的推移,我們會看到有最好的想法的藝術家,我想說,也許最具創造性的使用工具的方式最終會被認可,而不僅僅是使用新的東西或者與之類似的東西。

也可以說「好吧,你只是在用 Deep Dream 來形容 GAN」。我們完全同意這一點。為了讓人們開始得到相機和拍照,為了讓未來偉大的藝術家們崛起,你需要將技術展示出來。

此外,我認為我們所做的工作可能會促使人們去了解這個工具,他們也許會比我們更有創造力。我們不在乎這一點。因為我們不是在競爭。我們想要讓這項技術發光發亮,讓越來越多的人瞭解人工智慧,瞭解機器學習——我對機器學習充滿熱情,所以我想讓人們瞭解它。我想讓他們知道它有多棒,有多有趣。

我認為,最終,你不能愚弄人們——藝術家最終會脫穎而出,最好的作品自然會出現。一百萬年來這樣的過程一次次重複上演。我們希望並相信,最好的藝術家會得到他們應得的東西,得到他們真正應得的綻放。

未來人工智慧藝術之所以能夠具備趣味性,最重要的決定因素是技藝。我認為並不一定需要一系列的技術革新。我想我們現在已經有了這樣的技術,你可以用很多方式去探索潛在的傑作。你需要這樣的工作和奉獻才能找到一種方法發掘出這些傑作。

JB:對於人類來說,似乎區分出好的 GAN 藝術作品變得越來越重要。公眾有一種反烏托邦的觀點,認為人工智慧將取代藝術家。但是你剛才描述的正好相反。

HC:我完全贊成 

JB:人們使用 GAN 進行優秀的藝術創作的例子有那些?什麼是好的 GAN 藝術?

HC:是啊,什麼是好的 GAN 藝術作品的例子?複製以前做過的東西在藝術史上已經做了很多了。我認為這也是我們工作的很小一部分。

肖像在很長一段時間裡都是藝術中非常重要的東西,重新創造肖像並從不同的角度看它是一件有趣的事情。所以我們受到了啟發,我們認為這是一種非常引人注目的方式,能夠展示它的趣味性。

你的意思是我不認為機器會取代藝術家之類的東西。最後,藝術是為人類創造的,所以它需要有人類的參與。我想這也是我們工作中的一件事,那就是在某種程度上它真的像人類一樣會做出一些看似愚蠢的決定,所以我想這也是為什麼它能引起人們共鳴的原因。

比如,如果你做出了一個非常能夠引起機器的注意的東西,我們無法理解它,所以它對我們來說就不再有趣了。最後,是人們在欣賞藝術,而不是機器,所以把人的部分完全從藝術過程中移除沒有任何意義

相關文章