讀天才與演算法:人腦與AI的數學思維筆記17_歌曲的創作公式
躺柒發表於2024-05-04
1. 人為何創作音樂
1.1. 音樂一直具有演算法性質,這意味著在所有的藝術形式中,它受到人工智慧進步的威脅最大
1.1.1. 音樂也是所有藝術形式中最抽象的一種,它利用結構和模式,而正是這種抽象的性質使它與數學緊密相連
1.1.2. 在這個世界裡,演算法將像人類一樣得心應手
1.2. 音樂不僅僅是結構和模式而已,必須透過表演來賦予其生氣
1.3. 對宗教儀式的需求是人類程式碼的一部分
1.3.1. 宗教儀式由一系列的活動組成,包括手勢、言語和物品擺放,這些活動在一個神聖的地方按照固定的順序或模式進行
1.3.2. 從外部來看,儀式似乎是非理性或不合邏輯的
1.3.3. 對內部來說,它提供了一種聯絡團隊的重要方式
1.3.4. 隨著文明的發展,音樂繼續是儀式世界中的一部分
1.3.4.1. 從帕勒斯特里納到巴赫再到莫扎特,音樂的巨大進步往往是在宗教背景下取得的
1.3.5. 隨著我們內在意識的覺醒,“上帝”的概念將出現在人類身上
1.3.5.1. 隨著意識的發展,意識到自己頭腦中有一個聲音,此時你會感到震驚
1.3.6. 宗教儀式和音樂可以安撫大腦中的聲音,而自然的力量似乎是眾神所為
1.4. 音樂是人與人之間交流的社會行為,是友誼的象徵,是強大無敵的
1.4.1. 在德國發現的4萬年前舊石器時代的笛子表明,我們的祖先可能能夠進行遠距離的交流
1.5. 在創造改變思維的儀式時,音樂是一個強有力的因素
1.5.1. 不斷重複可以幫助改變我們的意識狀態,正如許多薩滿教儀式所證實的一樣
1.5.2. 我們的大腦具有與不同的心理狀態相對應的固有頻率
1.5.2.1. 恍惚音樂充分利用了這個事實,即每分鐘120拍的音樂最適合誘導人類產生幻覺體驗
1.5.2.2. 混淆多種感官輸入會導致大腦產生奇怪的靈魂出竅的體驗
1.5.2.3. 觸覺和視覺的組合可能使人產生肢體識別的障礙或假象
1.5.2.4. 我們經常能在發現早期的樂器時一同發現香料或草藥,因為它們的組合既能給儀式帶來一種氣味(嗅覺),也能給儀式帶來一種聲音(聽覺)
1.6. “吼板”
1.6.1. 吼板是一種自舊石器時代流傳至今的古老發聲器,在世界許多文化中都能找到其蹤跡
1.6.2. 一臂長的堅硬木板被固定在一根長繩的末端,只要持有者將它甩過頭頂並不斷旋轉,它就會發出一種360度環繞音響效果的轟鳴聲,這會給持有者帶來迷幻感,而聲音可傳至很遠的地方
1.7. 演算法已經學會了生成讓我們感動的聲音
1.7.1. Algoraves現在使用的演算法可以對跳動的人群做出反應,幫助DJ策劃舞曲和打碟
1.7.2. “深度巴赫”正在為教堂唱詩班創作更多的宗教合唱來歌頌上帝
1.7.3. 儘管這些演算法似乎已經破解了音樂的程式碼,但是機器內部仍然是毫無波瀾的
1.7.4. 這一切就像現代的數字“吼板”,它們仍然只是我們的工具而已
2. 創作公式
2.1. 音樂能言不能言,亦能言,不得不言
2.1.1. 維克多·雨果(Victor Hugo
2.2. 一首爵士樂會有一組標準的和絃,這些和絃會隨著樂曲的演奏出現並變化
2.3. 小號手的任務是在變換和絃時吹奏一條與和絃相吻合的旋律線條
2.3.1. 他吹奏的旋律必然是一個音符到另一個音符,同時還要保證能組成旋律,所以演奏爵士樂就像在二維迷宮中描繪一條線一樣
2.3.2. 和絃決定了垂直方向的動態,而他剛剛演奏的旋律決定了水平的動態
2.3.3. 隨著爵士樂即興成分的增加,音樂變得更自由,同時和聲的發展也會變得更加流動,這就要求小號手必須能敏銳地覺察並預判鋼琴手的發展意圖,其發展的方向是由前面和聲的發展決定的
2.4. 判斷即興演奏者水平的標準是,他是否會傾聽並預判出主奏樂器的發展意圖且配合得天衣無縫
2.5. 即興爵士樂演算法必須在實時互動中同時完成播放與對新材料的處理和響應
3. 爵士樂寶典
3.1. The Jazz Theory Book
3.2. 馬克·列文(Mark Levine)所著的《爵士樂寶典》(The Jazz Theory Book)是許多青年音樂家初學時的經典用書
3.3. 列文經常和20世紀最偉大的即興爵士樂演奏家迪茲·吉萊斯皮(Dizzy Gillespie)、弗雷迪·哈伯德(Freddie Hubbard)一起演奏
3.4. 一首偉大的爵士獨奏是由1%的魔力和99%的可解釋、可分析、可分類、可操作的東西組成的。
3.4.1. 馬克·列文(Mark Levine)
3.4.2. 99%都是可以放進演算法裡的
4. 馬爾可夫鏈
4.1. 在許多的演算法中都可以看到馬爾可夫鏈在起著重要的作用
4.1.1. 從模擬化學反應、經濟趨勢,到網際網路導航,再到評估生物種群、人口動態
4.1.2. 俄國數學家安德烈·馬爾可夫(Andrey Markov)選擇檢驗自己理論的,不是科學,而是普希金的詩
4.2. 帕維爾·涅克拉索夫
4.2.1. 和馬爾可夫的觀點恰恰相反
4.2.2. 現實世界中的事物是相互依存的(比如人的行為),所以現實中的事物並不恰好符合數學模式或分佈
4.2.3. 俄國的犯罪率統計是遵循大數定律的,但事實上,罪犯決定犯罪都是由個人意志決定的
4.3. 機率論的核心之一是“大數定律”
4.3.1. 機率論史上第一個極限定理屬於伯努利
4.3.2. 這是機率論中討論隨機變數序列的算術平均值向隨機變數各數學期望的算術平均值收斂的定律
4.3.2.1. 在隨機事件的大量重複出現中,往往呈現幾乎必然的規律
4.3.3. 如果你有一枚硬幣,而每拋一次硬幣都完全獨立於上一次拋硬幣,那麼當你多次拋硬幣時,正面和反面出現的次數之比就會越來越接近於一半對一半的比例
4.3.3.1. 拋擲硬幣4次,全是正面的機率是1/16,但隨著拋硬幣次數的增加,偏離對半分機率的可能就會降低
4.3.4. 馬爾可夫需要建立一個模型,在這個模型中,結果的機率取決於以前發生的事件,但長期來看仍然遵循大數定
4.3.4.1. 拋硬幣的結果並不取決於以前拋硬幣的結果,所以這不是馬爾可夫理想的模型
4.4. 每個事件的機率僅取決於先前事件的一系列事件被稱為馬爾可夫鏈
4.4.1. 預測天氣就是一個例子:明天的天氣肯定取決於今天的天氣,但並不特別依賴於上週的天氣
4.4.1.1. 明天的天氣只取決於今天的天氣
4.4.2. 儘管每天的天氣都依賴於前一天的天氣,但從長遠來看,無論我們的模型是從晴天、雨天還是陰天出發,下雨的機率都會趨向於相同的數值(32.35%)
4.4.3. 即使明天的天氣依賴於今天的天氣,長期的天氣預報也與今天的天氣無關
4.4.3.1. 透過資料我們可知,今天的天氣是什麼並不重要(即我們選擇哪一行來觀察),第十天的機率總是相同的
4.4.4. 從長期犯罪統計資料來看,罪犯決意犯罪是由個人自由意志決定的,這個論點是站不住腳的
4.5. 普希金(Pushkin)的《尤金·奧涅金》(Eugene Onegin)
4.5.1. 用它作為一個資料集來分析母音和子音的出現機率
4.5.2. 馬爾可夫提取了這首詩的前20 000個字母(大約佔整首詩的1/8),計算了母音和子音出現的次數
4.5.3. 一個子音後面會跟著另一個子音的機率是34%,而子音後面會跟著一個母音的機率是66%
4.5.4. 儘管前幾個字母在很大程度上取決於起始字母的選擇,但是馬爾可夫證明,從長遠來看,字母的分佈是一種模式
4.5.5. 即使是相互依賴的事件,如果它們受到固定機率的影響,也是一致的
4.6. 馬爾可夫鏈的一個重要性質就是其是無記憶的
4.6.1. 在當前狀態下,你可能需要一切可用的事件來預測下一個事件
4.6.2. 這種無記憶性也叫馬爾可夫屬性
5. 續作者
5.1. 第一個人工智慧即興爵士作曲演奏者
5.2. 弗朗索瓦·帕切特(François Pachet)
5.2.1. 在巴黎擔任索尼電腦科學實驗室(Sony Computer Science Laboratory)主任期間,帕切特發現人工智慧領域的學習工具可以幫他完成作曲的夢想
5.2.2. 他使用機率論中的馬爾可夫鏈公式寫出了世界上第一首人工智慧即興爵士樂,並創造了世界上第一個可以進行爵士樂寫作的演算法
5.2.2.1. 對爵士音樂家的即興演奏片段進行分析,給定一個音符,分析下一個音符出現的機率
5.2.3. 如果演奏一個特定的音符,那麼下一個音符上行或是下行的機率都是50%
5.2.3.1. 基於這樣的事實,該演算法將在音階上進行隨機抓取
5.2.3.2. 給予演算法的即興演奏次數越多,它分析的資料就越多,某一種特定的演奏風格就會出現越多
5.2.3.3. 不希望演算法生成與訓練資料雷同的東西,所以回溯過多是沒有好處的
5.2.4. 帕切特演算法的優點是你可以向其提供實時資料
5.2.5. 這種問句和答句的形式在爵士樂中很常見,因此該演算法可以和音樂家進行現場的旋律問答
5.2.5.1. 正因為該演算法可以生成與訓練資料相同風格的輸出內容,所以被稱為“續作者”
5.2.5.2. “續作者”會根據它剛剛演奏的內容以及訓練資料,來計算下一個特定音符出現的機率,然後以擲骰子的隨機模式做出選擇
5.2.6. 在另一個版本的演算法中,帕切特沒有選擇問句與答句的“問答模式”,而採用了一種“合作模式”
5.2.6.1. 演算法會根據演奏的一段旋律,利用它的機率演算來推測出正確的伴奏和絃,就像真人在伴奏一樣
5.3. 伯納德·魯巴特(Bernard Lubat)
5.3.1. 一位當代爵士音樂家
5.3.1.1. 對“續作者”進行了測試
5.3.2. 雖然它走在我前面,但毫無疑問它所發揮的一切的源頭還是‘我’
5.3.3. “續作者”已經掌握了魯巴特的音樂世界,但它不是簡單地重複他以前做過的事情,而是在探索新的領域
5.3.3.1. 它是一個展示探索性創造力的演算法
5.3.3.2. 它還透過向魯巴特展示他以前從未接觸過的方面,來促使其寫出的作品更具創造性
5.3.4. 對於魯巴特來說,這個演算法生成的輸出內容太有價值了:在演算法幫助下,他的作品更具創造性,他也變得更富創造力了
5.3.5. 魯巴特覺得在某種程度上他受到了身體的限制,而“續作者”卻沒有,這使得“續作者”有可能比他更有創造力
5.4. 這個演算法生成的結果讓編寫演算法的程式設計師和對演算法進行訓練的音樂家都感到驚訝,但它所帶來的意義不僅僅是創新和令人驚訝而已
5.4.1. 人們都傾向於安於現狀、故步自封
5.4.2. “續作者”已經開啟了新的音樂世界的大門
5.4.3. 與人類相比,計算機能夠更快地完成任務,處理更多的資料,但這一事實可能會導致人類創造力和人工智慧創造力之間有趣的緊張關係
5.4.4. 也許在未來,“續作者”將生成只有另一臺機器才能欣賞到的“聲音”,因為它的複雜性和速度超出了人類的極限
5.5. “續作者”正在以有趣的方式,在體裁、樣式、風格方面不斷進行著突破
5.5.1. “續作者”的突破,完成了很多了不起的事情
5.6. 雖然它創作的音樂片段在區域性是有意義的,甚至是相當令人驚喜的,但基於馬爾可夫鏈系統存在的一些內在侷限性,令它的作品最終還是不那麼令人滿意
5.6.1. 因為這些作品沒有總體的全域性結構,也就是並沒有實現真正意義上的“作曲”