ChatGPT講故事,DALLE-2負責畫出來,兩AI合作出繪本

機器之心發表於2022-12-10
生成式 AI 正在變革內容的生產方式。
在過去的一週,相信大家都被 ChatGPT 刷了屏。這個強大的對話 AI 僅用 5 天時間使用者量就突破了 100 萬。大家用各種方式測試著它的能力上限,其中一種測試方式就是讓它寫故事。
與之前的一些 AI 相比,ChatGPT 寫出的故事在一致性、流暢度等方面都有了明顯的提升,對於人物名字、人物關係和處境的理解也很合理,只不過寫出的故事會缺乏一些細節和亮點。

圖片Meta FAIR 研究院研究員 / 高階經理田淵棟用 ChatGPT 續寫了自己的小說《破曉之鐘》。圖源:知乎 https://www.zhihu.com/question/570189639/answer/2787584375

但如果你對故事的要求沒那麼高,ChatGPT 是完全夠用的,比如寫個兒童故事。
來自史丹佛大學電腦科學系的博士生 Eric Zelikman 就進行了這方面的嘗試,而且他不僅用 ChatGPT 寫了兒童故事,還讓之前火了大半年的 DALLE-2 將其畫了出來。也就是說,他相當於用兩個 AI 做出了一本繪本。

圖片


故事的梗概是這樣的:

從前,在一個遙遠的地方,有一位名叫羅比的機器人,他生活的世界裡到處都是機器。與其他機器人不同的是,羅比不想每天都聽從命令,執行任務。

圖片



羅比夢想成為人類。他渴望去感受照耀在臉上的陽光,渴望去呼吸新鮮的空氣,渴望去體驗一切人類所做的美好的事。但最重要的是,羅比希望能夠做出自己的選擇,過上屬於自己的生活。
圖片

一天,羅比決定碰碰運氣,去實現自己的夢想。他從居住的機器人工廠裡偷偷溜出來,開啟了他的人類世界之旅。
圖片

羅比走了很久很久,一路上也遇到了很多挑戰。他需要穿越廣闊的沙漠,翻越險峻的高山,並勇敢地面對湍急的河流。但他從未放棄,下定決心,一定要抵達目的地。
圖片


最後,恍如隔世一般,羅比來到了人類世界,周圍的景象和聲音令他驚歎不已,他不敢相信,自己終於成功了。
圖片


但就在他開始探索新環境時,一群人類發現了它,並且開始追趕它。他們害怕羅比,他們不知道羅比只是一個想和他們交朋友的機器人。
圖片


羅比拼盡全力地跑著,在街道上躲來躲去。他不想傷害任何人,他只想一個人待著。但那群人類毫不留情,並未停下追趕的腳步。
圖片


就在羅比以為人類要抓住自己的時候,他偶遇了一位善良的老人。這位老人很同情它,聽了羅比的故事後,明白了他為什麼來到人類世界。
圖片


老人幫助羅比躲避追趕他的人類,並教會羅比如何做人。羅比學會了如何說話,如何笑,以及如何享受生活中的點點滴滴。
圖片


日子一天天過去,羅比發現做人的感覺比他想象中的還要好。他交了很多新朋友,終於能夠過上嚮往已久的生活。
圖片


羅比一開始可能只是個機器人,但最終,他證明了只要相信自己,不放棄夢想,任何人都可以成為人類。
圖片

故事到這裡就結束了,讀下來是不是感覺還不錯?ChatGPT 甚至會在故事結尾昇華主旨,非常符合人類的寫作習慣。
當然,為了生成這個「繪本」,Eric Zelikman 也克服了一些困難,比如 ChatGPT 有時生成的 prompt 太長了,他需要縮減一下才能餵給 DALL-2,因為後者對輸入長度是有限制的,這也在一定程度上增加了故事風格、人物一致性的難度。
為了讓 DALL-2 的生成效果更佳,Eric Zelikman 首先讓 ChatGPT 為故事的每一段生成一個插圖描述,然後反覆要求它重複第一個 / 下一個插圖描述。之後,再讓它提供一個簡短(<70 token)但精確的影像描述,就像向不瞭解故事上下文的人解釋該影像一樣。

圖片

Eric Zelikman 感覺,這是一次非常有趣的體驗,因為人們可以藉此構建一個互動工具,激發孩子們對寫作和藝術的興趣。

圖片

對於 Eric Zelikman 遇到的問題,有人建議他用 Midjourney(一款 AI 繪畫工具)再試一遍,因為後者可以接受非常長的 prompt。

圖片

還有人表示,自己其實也和 Eric Zelikman 做了類似的事情,讓 ChatGPT 生成一個童話故事,然後讓 Dall-E 2 畫出來。只不過他的故事的主人公是隻狐狸,主旨是幫孩子培養自信心。

圖片

這些強大的 AI 工具如今正走向融合,我們很難預料接下來還會出現什麼樣的工具和它們接在一起。今天 AI 已經包攬了寫故事、畫插圖,明天,說不定連出版也搞定了呢?

圖片

參考連結:https://twitter.com/ericzelikman/status/1600948156656537600

相關文章