如果你們還覺得工程師在撩妹上沒有天賦的話,那你就大錯特錯了。
就在不久前 Facebook 的幾個程式設計師最近也弄出一款音樂神器,可以把一首曲子,用 6 種不同的樂器演奏出來。然後 Google 的技術大拿們也不甘示弱,用 AI 搞出了一個音樂合成器正式加入專業撩妹俱樂部。
程式碼音樂家速成指南
大家都知道,通過 CNN 可以將圖片進行風格重構,比如做點濾鏡,讓你的自拍照看起來像凡高的作品,業內也把這種卷積神經網路又叫神經網路遷移(Nural)。
受此啟發,工程師們嘗試把 CNN 運用到音樂上,希望搞點大事情,比如讓 AI 像人類一樣,用口哨來演奏音樂。
(小哥哥們認真 coding 的狀態神似郎朗
實操上,大家也都知道 AI 不可能直接讀取音符,所以首先必須將音符轉換成機器能夠識別的樣式,然後通過 CNN 進行解碼重構,再生成新的檔案。
經過不斷除錯,他們已經可以將同一首曲子,用 6 種不同風格的樂器演奏出來,包括模仿人類吹口哨。
Google 小哥哥怎麼搞 AI 音樂
FaceBook 小哥哥們鼓搗出的這套程式目前只能對音樂進行風格切換,聽起來還不夠浪漫,Google 的工程師隨即放了撩妹大招:
「為妹子創造一個獨一無二的聲音。」
Magenta 是 Google 內部發起的一個與音樂結合的 AI 專案,專門探索如何將機器學習應用到音樂創作中。他們釋出了 NSynth(神經合成器),這個專案是主要作者是 Yotam Mann ,他依靠深度神經網路來學習聲音的特徵,並根據這些特徵生成一個前所未有的聲音。
Yotam 認為之所以經典樂器會流行,就是因為無論是鋼琴還是吉他,或是二胡,都有自己獨特的音色和音域。而自己所寫的 NSynth 並不是將聲音簡單的混合在一起,也不是重構音樂風格。
而是利用原始聲音的聲學特徵來合成一種全新的聲音,比如將笛子和琴聲按比例進行搭配,創造出新的聲音。
在 Yotam 建立的 NSythTH 演算法中,先通過生成一個壓縮的聲音( 用 Z 表示 )。然後,解碼器網路將其轉換成回聲,再對整個系統進行訓練,使輸出的聲音儘可能更接近真實聲音。
為了降低 NSynth 的使用門檻,Magenta 跟 Google Creative Lab 合作建立了 NSynth Super,這是一款開放原始碼的音樂合成硬體產品。
通過預先載入的超 過10 萬個聲音,NSynth Super 通過演算法就已經創造出很多聲音,你可以通過撥號盤選擇這些聲音。當然,你也可以通過觸控式螢幕創造新的聲音。
目前,已經有不少專業的音樂製作人在使用這款產品。藝術創作需要靈感,這種全新的聲音合成在可玩性、創意性上同樣會給創造者提供一些不一樣的啟發。
如果你對 NSynth Super 原始碼、原理圖和設計模板等感興趣,可以在 GitHub 找到 demo。
這位眼神中透露著深情的小哥哥就是 Yotam Mann ,聽說他幾乎沒有單身過。
超神經小百科
單詞
Saturation
[ˌsætʃəˈreʃən] n. 飽和度
Exaggerated
[ɪgˈzædʒəreɪtɪd] adj. v. 擴大
片語
fundamental frequency 基音訊率
intuitive parameters 直觀引數
Single dog 單身狗