讀天才與演算法:人腦與AI的數學思維筆記24_預測性文字生成器

躺柒發表於2024-05-11

1. 起源

1.1. 人類講故事可能起源於“假如……”這種問答結構

1.2. 講故事是人類做安全試驗的一種方式

1.2.1. 如果你問一個人“假如……”,其實是在探索你的行為對他可能帶來的影響

1.3. 最早出現的故事極有可能就源自我們對在周遭混亂的環境中尋找某種秩序的渴望,想要在這個殘酷無情的宇宙中找到自身存在的意義

1.3.1. 圍坐在火堆旁分享當天的狩獵故事,可以幫助部落在第二天能獲取更多的獵物

1.3.2. 智人力量上的短板,在部落的集體智慧中得到了彌補

1.3.3. 這種智慧的力量隨著社交和分享的增加而增強

1.3.4. 營地的篝火點燃了人類創造力的火種

1.3.5. 這是一種早期的科學形式

1.4. 演算法能不能構想出其他有趣的動物以便推動故事情節的發展?

1.4.1. 就像那些長有頭、軀幹和腿的動物一樣,將不同事物的組成部分解構,然後再透過混合進行重構,就可以創造出千奇百怪的新事物

1.4.2. 這些具有奇技異能的新生物是促使新故事誕生的極佳催化劑

2. 預測性文字生成器

2.1. 到目前為止,大多數例子都基於自上而下的程式設計思想

2.1.1. 按照明確的規則,可隨機填充單詞的詩歌模

2.1.2. 將經典作品轉換為新作品的程式碼

2.1.3. 透過程式設計獲取資料並將其轉化為故事的演算法

2.1.4. 這些程式實際上並沒有太多自由發揮的空間

2.2. 機器學習正在改變這一切

2.2.1. 演算法可以從小說作者的所有作品中學習,探索他們的寫作方式

2.2.2. 如果他們喜歡使用某個特定的詞,這個詞後面很可能會跟著其他出現頻次高的詞

2.2.3. 透過構建作者使用單詞的機率圖,演算法可以生成該作者作品的續篇

2.2.4. 這就是預測性文字生成器的工作原理,其產出的文學作品既發人深省又引人入勝

3. Botnik

3.1. 一個名為“Botnik”的公司倡導使用機器學習來創造新文學

3.1.1. 一家研發人工智慧自然語言技術的公司

3.1.2. 其致力於開發能與人協作的內容創作工具,即用人工智慧挖掘人類的創造潛能

3.2. 該公司由作家傑米·布魯(Jamie Brew)和《紐約客》(The New Yorker)前漫畫編輯鮑勃·曼考夫(Bob Mankoff)於2016年創立

3.3. 演算法有時會輸出出人意料的超現實主義作品

3.3.1. Botnik為《宋飛正傳》寫出了精彩的劇本

3.3.2. Botnik還製作了一份感恩節食譜,並在YouTube上釋出了一段影片,讓人們瞭解如果把烹飪這件事交給演算法

3.4. Botnik在學習了《哈利·波特》七卷叢書之後,生成了三頁幾乎可以以假亂真的續集

3.4.1. 有些時候,演算法才是最純粹的“天才”

3.5. Botnik確實可以從構建句子的方式中學習、辨認、識記,但其所捕捉到的只是這樣一個事實存在:作者的寫作風格

3.5.1. 只捕捉到了這一點:文字的區域性,卻沒有從整體上考慮敘事結構

3.5.2. 就像爵士樂的“續作者”一樣,它可以生成一些以假亂真的樂句,但最終還是難逃走向乏味、無聊和枯竭,因為演算法不知道該繼續向何處發展音樂

3.5.3. 小說家們很快就會失業是不大可能的

4. Scheherazade-IF

4.1. 2012年,喬治亞理工學院的馬克·裡德爾(Mark Riedl)和他的同事開發了一個會講故事的演算法“Scheherazade-IF”

4.1.1. 這個演算法名字中的“Scheherazade”來源於王后山魯佐德為暴虐的國王講故事來安撫他的傳說,她是一位優秀的故事講述者

4.1.2. “IF”取自“Interactive Fiction”,意為互動式小說

4.2. 目標是在故事發展可能性的迷宮中找到一條更加連貫暢通的路徑

4.3. 由於人類具備許多現實世界的知識,所以他們都是天生的、優秀的故事講述者

4.4. 如果你要求Scheherazade-IF構建一個關於某個特定主題或情境的故事,而這個主題或情境它之前從未遇到過,那麼它就會透過蒐集和消化之前的故事來進行學習

4.5. Scheherazade-IF從由一大群人構成的大規模知識庫中汲取新的資訊並充分消化,再將這些範例彙總形成一個樹狀圖,圖中列出故事發展的各種可能方向

4.5.1. 好的故事講述者,會在故事發展樹狀圖中找到最佳的路徑

4.5.2. 在很多故事情節會隨玩家的選擇而走向不同結局的開放性電腦遊戲中,這種方法非常奏效

4.6. Scheherazade-IF正嘗試透過它在網上收集到的資料,生成故事發展的可能性樹狀圖,進而實現這一點

4.6.1. 它所做的選擇獲得的滿意度得分可以與人類相媲美,遠遠高於隨機生成的故事

5. Whim

5.1. What If Machine

5.2. 由歐盟資助的Whim(What If Machine)專案所試圖解決的問題

5.2.1. 從網上搜羅以前的故事把它們重新組合在一起固然不錯,但想象一下如果是前所未見的場景會有怎樣的結果?

5.3. 作家在嘗試創造新作品時面臨的一個問題是,他們會卡在自己有限的固定思維模式裡

5.3.1. Whim透過提供煥然一新的故事場景,把故事講述者帶出他們的舒適區

5.4. 由Whim生成的一個故事情節,最終促成了一部音樂劇於2016年在倫敦西區上演

5.4.1. 篩選演算法分析音樂劇走紅或慘敗的原因,為Whim提供故事情節進一步發展的建議

5.4.2. 2016年春天,《飛越藩籬》在倫敦西區的藝術劇院進行了短暫的演出

5.4.2.1. 為完成這一作品,人類的干預可能和電腦的創造力一樣多

6. 普洛普寫手

6.1. PropperWryter

6.2. 在生成童話故事方面,另一個演算法“普洛普寫手”(PropperWryter)更勝一籌

6.3. 1928年,形式主義語言學家、民俗學家弗拉基米爾·普洛普(Vladimir Propp)在他的《故事形態學》裡提出,俄國民間故事有31種敘事原型

6.4. “普洛普寫手”把Whim提供的情節最終發展成為一個關於格林漢姆普通婦女反核運動的故事

6.4.1. 其音樂由另一個名為“機器人勞埃德·韋伯”(Android Lloyd Webber)的演算法提供

7. “自動化”數學家

7.1. 數學家如果能提出諸如“假如……”這一類的問題,就意味著他距離突破知識邊界已經只有一步之遙了

7.1.1. 假如有一個數的平方值為–1

7.1.2. 假如彎曲空間中,兩條平行線可以相交

7.1.2.1. 黎曼幾何

7.2. 打破固有的結構框架,從變化中探索有價值的新發現,是編寫新的數學“故事”的經典工具

7.3. 如果數學是用數字講述的故事,那麼目前的演算法在生成新的數學故事方面有多大的價值呢?

8. 整數序列線上百科全書

8.1. oeis dot org

8.2. 其目的旨在收集所有有趣的數列,並探索生成這些數列的公式或方法

8.3. 由素數(或者說除了1和它本身以外不再有其他因數的自然數)構成的數列

8.3.1. 對於該數列,很難找到一個通項公式來生成下一個數,這也是數學界公認的未解之謎之一

8.4. 可重分解因子數是一項由機器生成的發明

8.4.1. 可重分解因子數”(refactorable numbers)的概念,其定義為:數列中每個數字的因數個數,本身又是該數字的因數

8.4.2. 該數列中的奇數,被稱為“奇數可重分解因子數”

8.4.2.1. odd refactorable numbers

8.4.3. 演算法推測:所有的奇數可重分解因子數都是完全平方數

相關文章