讀天才與演算法:人腦與AI的數學思維筆記16_音樂圖靈測試

躺柒發表於2024-05-03

1. 艾米

1.1. 人工智慧作曲家

1.1.1. 分析機可能會生成任意複雜程度、精細程度的科學的音樂作品

1.1.1.1. 阿達·洛夫萊斯

1.1.2. 巴赫的作品是大多數作曲家開始學習創作的起點,也是大多數計算機開始學習作曲的起點

1.1.3. 讓我震驚的不是這首作品讓我為以為它是巴赫創作的,而是在短短一首樂曲的時間內我被所聽到的打動了

1.1.3.1. 背後的演算法是如何讓我認為所聽到的是偉大的巴赫創作的樂曲

1.2. 大衛·柯普(David Cope)

1.2.1. 決定在樂思枯竭的狀況下求助於演算法,探索阿達的預言

1.2.2. 如果有一種演算法可以準確地理解、把握他的創作風格,那麼每當他的創作陷入困境並無法繼續的時候,這個演算法就能給他提供與他創作風格相相容的建議

1.2.3. 至少演算法會幫助他理解並找到可能會是更好的選擇

1.2.3.1. 這個演算法將成為激發創造力的催化劑

1.2.4. 為他的這一套試驗命名為“音樂智慧試驗”(experiments in musical intelligence),簡稱EMI

1.2.5. 從演算法試驗中誕生的“作曲家”被命名為艾米(Emmy),起這個名字一方面是避免與英國百代唱片公司(EMI)重名,另一方面是柯普想讓艾米更人性化

1.2.6. 柯普相信每一段音樂都內含了編碼和指令,用以創造出其他相似但微妙不同的音樂片段

1.2.6.1. 面臨的問題是如何將這些指令具體化成程式碼

1.2.7. 在艾米的幫助下,他開始為每位作曲家建立一個與他們的風格相對應的資料庫

1.2.7.1. 他們具有專屬特性的音樂語言語彙和技法

1.2.7.2. 音符就是字母

1.2.7.3. 這些特徵可能會以不同的速度、節奏和音高出現,但對於發現潛在的模式,數學是很拿手的

1.2.8. 當許多不同的片段適合組合時,就需要做出選擇了

1.2.8.1. 柯普不喜歡使用隨機性去選擇,而更喜歡使用數學公式去選擇

1.3. 歌劇《搖籃墜落》(Cradle Falling)

1.3.1. 柯普在創作歌劇上下了7年的功夫,在艾米的幫助下,他用兩週時間就完成了這部歌劇的創作

1.3.2. 歌劇《搖籃墜落》(Cradle Falling)發表時,他決定不讓外界知道這部作品是在艾米的幫助下創作的,以免使樂評人產生偏見

1.3.3. 發表兩年後的1987年,歌劇首次公演時,柯普很高興地發現這部作品獲得了他職業生涯中最好的一些評論

1.3.3.1. 這作品太感人了!無疑是一部現代的經典名作!

1.4. 柯普的分析揭示了作曲家的作品帶有強烈的富有個人特色的模式性

1.4.1. 從巴赫到莫扎特,從肖邦到勃拉姆斯,從格什溫到斯科特·喬普林,每個人似乎都有自己偏愛的特定的動機

1.4.2. 在音樂中,這些指標就是音符的模式,它們就像畫家標誌性的筆觸一樣

1.4.3. 有些作曲家,如巴赫,甚至在樂譜上用音符來簽名

1.4.3.1. 巴赫在其最後的鉅作——《賦格的藝術》中最後一首未完成的賦格里,以“音樂簽名”的方式把自己的姓名“BACH”留於其中

1.4.3.2. 在德國樂理體系裡,與B對應的唱名是降si,與A對應的唱名是la,與C對應的唱名是do,與H對應的唱名是si

1.4.4. 在將作品分割成一個個單元和標誌性動機,即形成每個作曲家的資料庫之後,柯普的演算法轉向了他所說的“重構”

1.4.4.1. 識別、拆解、分析一個複雜結構是一回事,找到一種方法將經過拆解的構件重新組合構造成一個全新的結構是另一回事

1.4.4.2. 為每一部分都建立了熱圖

1.4.5. 在著手識別作曲家的標誌性樂句時發現,這種方法的難點在於確定音符的數量

1.4.5.1. 如果太少了,那麼滿篇都是

1.4.5.2. 如果太多了,樂句就會被過度確定,以致輸出變成了複製原作品

1.4.5.3. 除了音高,你還需要考慮節奏模式

1.5. 1993年,柯普和艾米準備發行他們的第一張專輯《設計的巴赫》(Bach

By Design),這張專輯收錄了艾米創作的巴赫風格的樂曲

1.5.1. 專輯中的曲目因為難度太高,人類演奏員難以勝任,所以他們不得不求助於一臺既能作曲又能演奏作品的電腦

1.5.2. 並沒有受到樂評人的好評

1.6. 在1997年推出了第二張專輯

1.6.1. 這張專輯裡收錄的作品的風格包括他分析過的其他作曲家,如貝多芬、肖邦、喬普林、莫扎特、拉赫曼尼諾夫和斯特拉文斯基等

1.6.2. 不一樣的是,這次專輯中的曲目全是由人類音樂家演奏的

1.6.2.1. 樂評人的反應要積極得多

1.7. 把艾米輸出的音樂稱為人工智慧創作的音樂是個騙局

1.7.1. 艾米的創作依賴於作曲家資料庫

1.7.2. 作為作曲家,柯普擁有職業的敏感性和專業的分析工具,可用於選出與作曲家風格相對應的元素,並重組這些元素

1.7.3. 艾米的大部分創意來自柯普和歷史上偉大的音樂大師的作品

1.7.4. 柯普使用自上而下的編碼過程構建了艾米,是柯普編寫了所有的程式碼用來輸出音樂

1.7.4.1. 可以將更具自適應性的新演算法應用到作曲家的原始資料裡,而無須經過人類音樂分析的煩瑣過程,並且我們可以訓練這些演算法從零開始學習音樂理論

1.8. 打破傳統規則是創造性思維的標誌

1.8.1. 早在13世紀,在作曲的規範裡就禁止使用平行五度,直至今日這還是作曲界的共識

1.8.2. 平行五度(parallel fifths)指的是樂曲的兩個聲部隔開純五度平行進行

1.8.3. 在分部寫作中,兩聲部同向進入純五度,叫作隱伏五度,這種進行中隱含著平行五度

1.8.4. 巴赫有時也會打破規則,使用平行五度

1.8.4.1. 創作的樂趣之一就是打破規則,這是實現創意的最佳機會

1.8.5. 和聲有一種二維的特性:和聲必須在垂直方向上有意義,而旋律本身在水平方向上也必須有邏輯並且和

1.8.5.1. 創作和聲作品並將這兩個維度結合起來是一個考驗

2. SPEAC

2.1. 如果資料庫是字典,那麼“SPEAC”就是作曲家使用字典中的單詞編寫樂句的方式

2.2. 確定了樂句的五個基本組成要素

2.2.1. Statement(宣告):“簡單存在”的樂句,只能做重複

2.2.2. Preparation(準備):以出現在S或其他要素前為前提,修改其含義的要素

2.2.3. Extension(擴充套件):一種擴充、延展S的方法

2.2.4. Antecedent(先導):有重大暗示、引導作用並要解決問題的樂句

2.2.5. Consequent(解決):將A未解決的問題解決的樂句

2.2.5.1. C通常與S具有相同的和絃或旋律片段,但是它們具有不同的含義

2.3. 許多古典主義時期的作曲家都會使用這種套路來作曲,有時他們是在不知不覺的狀況下使用,但通常他們在學習作曲的時候就學會了這種作曲技法

3. 測量音程的和諧度

3.1. 音程指兩個音級在音高上的相互關係,即兩個音在音高上的距離,其單位是“度”

3.2. 若純八度音程和純五度音程是和諧的,不會造成很大的緊張感

3.2.1. 這在數學中也得到了證實:兩音之間的振動頻率比是小整數比:純八度是1:2;純五度是2:3

3.3. 鋼琴上兩個相鄰鍵之間的音程(小二度或半音)就會造成很強的緊張感

3.3.1. 在數學中也反映了這一點:它們的振動頻率比是更大的數字之間的比(15:16)

4. 音樂圖靈測試

4.1. 柯普與道格拉斯·霍夫斯塔特(Douglas

Hofstadter)合作,在俄勒岡大學舉辦了一場音樂會

4.1.1. 第一首是巴赫所作但並不廣為人知的作品

4.1.2. 第二首是艾米以巴赫風格創作的作品

4.1.3. 第三首是音樂理論教授史蒂夫·拉爾森(Steve Larson)以巴赫風格創作的作品

4.1.4. 這三首曲目由拉爾森的妻子,鋼琴家威妮弗雷德·科納(Winifred

Kerner)按隨機順序演奏

4.1.5. 演算法艾米所做的作品被大家投票表決為“巴赫本人的作品”

4.1.6. 巴赫本人的作品居然被大家投票表決為“拙劣的偽造品”

4.2. 霍夫斯塔特

4.2.1. 霍夫斯塔特是一位電腦科學家,著有經典著作《哥德爾、艾舍爾、巴赫:集異璧之大成》(Gödel,Escher,Bach:an

Eternal Golden Braid)

4.2.2. 作曲是規則、模式、演算法以及其他諸多因素的融合,這就是霍夫斯塔特所說的“環遊世界,行萬里路”所得到的東西

4.2.3. 還有一次,霍夫斯塔特演奏了兩首曲子,一首是肖邦的,另一首是艾米創作的肖邦風格的曲子

4.2.3.1. 觀眾中有許多作曲家和音樂理論家,但他們都認為電腦生成的曲子是肖邦所作

4.3. 同一部作品,卻讓聽眾的態度發生180度大轉變,而其中唯一的改變是,他是否知道作品是由計算機程式碼生成的

4.4. 演算法觸及到了人們創作音樂的核心

4.4.1. 音樂在很大程度上是由‘即興重複樂段’組成的

4.4.2. 沒有哪首富有表現力的音樂是不使用演算法的規則來創作的

4.4.2.1. 柯普

4.4.3. 只有那些真正的門外漢才不敢承認他們的情緒狀態可以被程式碼左右

4.4.4. 音樂變成一種純粹客觀、冷酷的東西

4.5. 與其說音樂像數學,不如說數學像音樂

4.5.1. 儘管音樂可能比我們通常理解的更加數學化和編碼化,但這並不會影響、剝奪音樂情感的本質

4.5.2. 所喜愛的數學包含著巨大的情感內容,這讓我們被其深深吸引

4.5.3. 那些有能力欣賞數學語言的人會隨著一個曲折的證明而心潮澎湃,就像我們很多人會被一段動人心絃、飽含深情的音樂所激勵、感動一般

4.6. 在我們大腦中執行的“人類程式碼”,已經進化到對構成自然界的混亂的抽象結構具有高度的敏感性

4.6.1. 當我們聽音樂或探索具有創造性的數學問題時,我們被暴露在最純粹的結構形式中,我們的身體會在情感上做出反應,用以表明對這種結構的認識

4.7. 非隨機序列在底層基礎上可以用某種演算法壓縮資料,而隨機序列並不能

4.7.1. 音樂與噪聲的區別在於其內含的演算法不同

4.7.2. 音樂在某種程度上是對生活經歷的情感反應

4.7.2.1. 其實是聽眾把他們自己的情感經歷帶入到他們所聽到的音樂中

4.7.2.2. 聽眾、觀眾或讀者,在一件藝術作品的創作過程中所起的作用常常被低估

4.7.2.3. 許多作曲家認為這種情感反應來自於音樂的結構,但是,你無法為情緒程式設計

4.7.3. 而演算法都是在隔音的錄音棚裡完成作品的,沒有與周圍的世界產生聯絡、互動

4.7.3.1. 沒有體驗,就不要指望它能真的模仿做出大師之作

4.8. 音樂和情感之間的關係一直是作曲家們“魔力”的源泉

4.8.1. 情感不屬於音樂,而屬於聽眾

4.8.2. 音樂本質上是無法表達任何東西的,無論是一種感覺,一種心態,一種心理情緒,一種自然現象

4.9. 我們經過長期的默許或根深蒂固的思維定式作為標籤和慣例,給音樂增添、強加了這種屬性

4.9.1. 我們已經無意識或習慣性地混淆了音樂的本質

4.10. 作曲家可能會選擇一個小調來捕捉一種情緒,這意味著一種直接的編碼,但音樂理論還沒有發展到我們能充分理解這種編碼如何運作的階段

4.10.1. 也許作曲家已經成功地識別了大腦編碼某些情緒的方式

4.10.2. 巴赫喜歡寫謎題一樣的賦格曲

4.10.3. 勳伯格開創了十二音體系

4.10.4. 巴托克使用斐波納契數列作曲

4.10.5. 梅西安在《時間結束四重奏》中用質數變值作為四重奏的框架

4.10.6. 菲利普·格拉斯師從布朗熱學習作曲期間感覺學業異常艱難,但他最終脫穎而出,開創了簡約主義音樂

5. 斯特拉文斯基

5.1. 認為約束是他產生創造力的關鍵

5.2. 我越是限制自己的領域,越是給自己設定障礙,我的自由越將變得偉大和有意義

5.2.1. 我將會走得更遠

6. 電梯音樂

6.1. 又被稱為“襯托音樂”

6.2. 即安靜柔和的背景音樂

6.3. 這樣的音樂在過去被稱作“電梯音樂”,因為我們經常在電梯裡聽到它

6.4. 這種音樂是專門設計出來讓人放鬆心情或增加活力的

6.5. 有時候,你甚至沒有意識到正在播放這種音樂,但其總是會讓你有所反應

7. 深度巴赫

7.1. DeepBach

7.1.1. 音樂專業學生蓋坦·哈德耶勒斯(Gaëtan Hadjeres)為他的博士論文開發的一種演算法

7.2. 該演算法旨在透過現象看本質,將巴赫的作品二維化,並進行分析

7.2.1. 不是在時間軸上向前組合,而是向後檢視

7.3. 基於這種多維度的分析導致,“深度巴赫”創作出了比以前的演算法所做的在結構上更加連貫的聖詠

7.4. “深度巴赫”的這種分析仍然是區域性層面的分析

7.4.1. 其以每個音符為中心向四周擴散,一組一組地觀察並進行分析,但是“音群”的大小是受限制的

7.4.2. 在“深度巴赫”的演算法中,“音群”的範圍是以某音符為中心的前後各四拍

7.5. “深度巴赫”的作品有50%被認為是巴赫的

7.5.1. 學習過作曲的志願者成績稍好,但仍然有45%的“深度巴赫”作品被認為是巴赫所作

7.5.2. 巴赫在他的作品中沒有犯任何錯誤,然而他25%的作品被判定為機器生成的

7.6. 任何試圖向大師學習的專案的關鍵難點在於缺乏良好的資料

7.6.1. 在計算機影像識別的領域,演算法會有數百萬張影像訓練自己

7.6.2. 在“深度巴赫”這個演算法中,只有區區389個資料採集點,而大多數作曲家遠沒有巴赫這樣多產

7.6.3. 測試巴赫的聖詠是很有實踐意義的,因為其提供了一組非常相似的單一現象的例子

7.7. 人類創造的藝術不受機器進步影響的終極安全鎖

好作品的數量太少,機器無法學習如何複製

相關文章