在AI面前,Rapper要率先失業了?

AIBigbull2050發表於2020-03-16

隨著 AI 在日常生活中的逐漸普及與應用,在“網際網路+”以及“工業製造4.0”的新時代背景下,具備通訊、網路與人機互動功能的AI作曲覆蓋到教育科普、藝術表演和娛樂服務等領域已是大勢所趨。那麼這種 AI 音樂背後藏著怎樣的奧祕呢?它又會對音樂行業造成怎樣的影響呢?



近期,美國數字研究機構Space150進行了一項有趣的試驗:基於人工智慧(Artificial Intelligence,簡稱AI)技術,模仿知名說唱歌手Travis Scott的人聲和音樂風格,做出了一個說唱機器人“Travis Bott”。

這個試驗的目的是為了看AI到底能夠持續創造出什麼。事實上,“Travis Bott”真的創作了一首歌《Jack Park Canny Dope Man》,且歌詞和旋律均由自己完成。同時,Space150還使用基於AI的人體影像合成技術 “Deepfake“,為這首歌拍攝了MV。

說實話,與以往的AI歌曲不同,這首AI歌曲在對真人繼續學習後,近乎到底了真人的聽感。國外網友在MV下面留言道。“better than real trvis(比真人還好)”“Pretty amazing, this is only the beginning(太棒了,這僅僅是個開始)”,甚至開始擔心AI會奴役人類,但自己還是會買票去看。

原理上,Space150採用附加神經網路技術(Additional Neural Network)創造出旋律和打擊樂伴奏,再將Travis Scott的歌詞輸入“文字生成器模型(Text Generator Model)”,兩週後,AI“Travis Bott”開始建立了歌詞的韻腳(rhymes)。

從效果來看,Travis Bott模仿Travis Scott幾乎達到了以假亂真的地步,完全融匯了Travis Scott作品以及人物魅力的最主要的外顯特徵,以至於被調侃可以加入Spotify的說唱熱門歌單《Rap Caviar》。與此同時,該專案也進一步驗證了人工神經網路技術(Artificial Neural Networks)的進步,有助於探索未來AI在音樂中的應用價值。

不可否認的是,AI已經漸漸地嵌入到我們的日常生活中。在“網際網路+”以及“工業製造4.0”的新時代背景下,具備通訊、網路與人機互動功能的AI作曲覆蓋到教育科普、藝術表演和娛樂服務等領域已是大勢所趨。而面對AI音樂的優異表現,也讓我們思考: 音樂人在與AI音樂的共生中,是否會遭遇到AlphaGo式的碾壓?



事實上,AI作曲(Algorithmic Composition,也稱“演算法作曲”)並不稀奇,複製Travis Scott也並非難事。

早在2016 年,索尼旗下的電腦科學實驗室(Computer Science Laboratories ,簡稱Sony CSL)研究人員哈傑里斯和帕切特就曾開發了一個名為“DeepBach (深度巴赫) ”的神經網路。他們利用巴赫創作的 352 部作品目來訓練DeepBach,創作出了2503首讚美詩。

而第一個正式獲得世界地位的AI虛擬作曲家則是由2016年誕生的初創公司Aiva Technologies推出的AIVA(Artificial Intelligence Virtual Artist)。

它的創作方向主要是古典音樂、影視配樂,發展到現在也逐漸有了其他型別的作品,例如搖滾樂、流行樂等。

作為虛擬音樂人,它通過了法國和盧森堡作者權利協會(SACEM)的合法註冊,並擁有自己的署名版權。在AI領域而言,複製一位或多位音樂人的音樂風格的工作也許早已在進行中。





目前來看,無論是DeepBach、AIVA抑或是Travis Bott,AI作曲背後都是一種基於人工神經網路的深度學習(Deep Learning)技術。在這種深度學習中,程式設計師必須搭建一個多層“神經網路”,並在多層的結構中分別加以程式設計,從而可以處理各種輸入和輸出點之間的資訊。



來源於:2017·菠蘿科學獎,人工智慧主題解讀



譬如說,DeepBach被輸入的是巴赫的362部作品,AIVA被輸入的資訊是以巴赫、貝多芬、莫扎特等為代表的古典作曲家作品的大資料庫,而Travis Bott被輸入的則是Travis Scott的作品、人聲以及音效。

在資料輸入後,人工神經網路會找到眾多被輸入作品之間存在的規律,繼而形成對音樂風格的理解。

但這個音樂風格並不是最終的產物,其主要目的是用來預測,AI程式會帶著它對音樂風格的預測繼續執行,而在前方將會遇到下一個驗證資料集。

這個資料集 會告訴它預測的正確與否,正確與錯誤的回饋都將被AI記住,在不斷的高速學習中,AI的預測能力就會越來越強,最終掌握程式設計師大資料中歸總後的曲風,進而能編寫出自己的曲子。

而AI創作者“Travis Bott”的突破,則在於其不止是輸入了Travis Scott的作品,更輸入了人聲及音效,文字與聲音的輸入與輸出在深度學習上又更上了一個臺階。


來源於《I am AI 》系列短紀錄片


這種深度學習,看似只是基於人類大腦的神經結構簡單模式,但在某種程度上已經可以像人類一般“思考”了。

這也使得AI能夠在資料中理解並塑造高度抽象化的模型,例如旋律中的模型,或者人臉的特徵。

但從人工智慧音樂的發展沿革而言,人工神經網路只是AI作曲的主要技術之一,與其他演算法相比,有其優點也有其劣勢。

就優勢而言,具有自學能力、聯想儲存功能、高速尋找優化解的能力是人工神經網路較其他演算法最卓越的地方。


來源於:2017·菠蘿科學獎,人工智慧主題解讀



但其劣勢也較為明顯:

  1. 著名的“黑匣子”問題,意味著你不知道神經網路將會如何產出結果,更不知道為什麼會產生這種結果;
  2. 與認知不同,作曲是更高層次的智慧活動;
  3. 耗時耗力;
  4. 資料饕餮,相較於傳統的機器學習演算法,需要更多的資料;
  5. 算力成本較為昂貴。



在實踐中,即便是最先進的深度學習演算法,要實現真正深度神經網路的成功訓練,仍需要數週才能完全訓練完畢。而目前AI作曲在主要技術上尚不存在最優解,大多采用混合型演算法(Hybrid Algorithm)。



與此同時,AI作曲的整體不足也較為顯化。正如前文所言,AI作曲本質上就是大資料和雲端計算,AI音樂產生的過程就是機器根據程式設計師輸入的要素或者是模式,在龐大的資料庫中總結提取與之相匹配的特徵,而後根據這些特徵提取各種資料元素進行新的組合或者是延展。

這裡面必然存在一個問題是:這個巨大的資料庫如何區分哪些資料是有版權保護的?哪些是公共資料?資料庫的搭建者如何保障具有版權資料的權益?使用資料庫的主體如何做到不侵權?

很顯然,目前的AI作曲在某種程度上仍舊無法完成或者說無法自主完成這一任務,版權的規避大多來自於程式設計師的有意為之。

2017年,Aiva Technologies對AIVA選擇專注古典音樂的解釋也正好回應了程式設計師對於AI作曲版權的刻意設計:“用來訓練Aiva的古典音樂資料庫不涉及版權問題,因為版權都過期了。”

對於開頭的Travis Bott而言,其對於Travis Scott的學習中,作品庫、人物形象的取樣必然也要先取得Travis Scott的授權,但其學習後生產出的作品又如何避免對Travis Scott形成抄襲呢?

這一情況,也是造成目前市場上AI作曲質量參差不齊的原因之一,某種程度上來說,抄襲或許很難避免。

查重工具 (Plagiarism Checker)以及查重的尺度在這裡就顯得尤為重要了,但就目前的實踐來看,人類音樂人歌曲抄襲判斷標準都還在尋求統一化中,何論AI作曲?

而即便AI作曲經歷千辛萬苦後終於生產出一個純原創、不涉及任何侵權的作品,他(她)又將面臨到版權認證的問題。

根據我國《著作權法》對於著作權的定義:“著作權是著作權法賦予民事主體對作品及相關客體所享有的權利。”其中,民事主體指公民、法人或非法人組織。AI在主體身份上就無法獲得認可,權利的獲得與放棄都變得尤為複雜。如果產生侵權糾紛,將難以解決。

比如,微軟小冰獨立創作的詩集《陽光失了玻璃窗》,作品一經發布後就出現了很多的盜版以及很多不規範引用。這種通常意義上的侵權,卻因為缺失法律規定的缺失,版權的歸屬也就誰都說不清,侵權也就聽之任之了。

但值得一提的是,相較於國內的空白,國外對於AI作品的放寬與認可已然成為一種常態,英國、南非、紐西蘭屬於第一批明確認可AI版權的國家。而美國、日本、澳大利亞雖然在成文法上並未有明確規定,但在司法實踐中都進行了不同程度的嘗試。這也是為什麼美國在成文法上未對AI作品進行認可,但在司法實踐中卻有勝訴的案例。

但中國因為是成文法國家,判例法並不是法的正式淵源,無法與普通法系(或英美法系)形成法官造法的司法實踐,所以從制度上明確AI作品才是最根本的。



不可否認的是,受制於多國在AI領域以及法律操作上的水平差異,要獲得大範圍的認可或許仍有待時日。當然,在其中取巧也較為簡單,在AI生成的作品加入人類藝術家的名字就可以突破這一桎梏。


2018年9月7日,AIVA的純音樂專輯《艾媧(Vol.3 from artificial composer Aiva)》的做法是:專輯還是AIVA的,但每首曲子都會標註“feat. Aiva Sinfonietta Orchestra, Brad Frey”,表明那位音樂監督在“演奏”中的貢獻,團隊成員就可以將作品進行商用。



總的來說,複製Travis Scott對於AI來說並非難事,但要處理其中的版權糾紛以及進一步將AI技術提升卻並非一日之功。




AI音樂無疑是一個歷時已久,但在這幾年蓬勃發展的朝陽產業。

1974年,Rader系統的出現是帶有AI作曲系統真正的開始。與現在意義上的AI有所不同,其運用了AI中可運用規則的部分,使得機器根據旋律、和聲生成的規則進行權衡,並且對音符與和聲搭配的合適比重進行選擇。此後隨著對音樂生成系統研究的不斷深入,出現了可完成自動低音和聲生成的Snobol系統,以及可用來生成巴赫風格和聲的Choral系統(Ebciogln產品,專家系統)。

1993年,出現了運用人工神經網路學習模式進行和聲生成的Musact系統,以及基於人工神經網路和“限制滿意度技術”相結合方式,可根據旋律進行巴洛克風格和聲生成的Harmonet系統。這些都是現代AI作曲系統的鼻祖,具有里程碑意義。

當代AI作曲系統的開發,大多從Google的Magenta開始萌芽。Magenta是Google於2015年底開源,並用TensorFlow機器引擎學習的一種人工智慧技術,該專案旨在開發AI技術創作出音樂以及其他藝術形式,主要子專案有NSynth Super、Onsets and Frames以及MusicVAE。

此後,各類AI系統、產品開始迅速發展。其中,較為有代表性的程式開發有:2017年Taryn Southern專輯《I Am AI》採用的Amper Music應用、2018年Skygge錄製發行《Hello World》使用的Flow Machines(Sony旗下產品)工具,以及2019年OpenAI開發的一種用於生成音樂作品的深層神經網路MuseNet。


目前,國外較為成熟的AI音樂公司,除了Google、Sony、Amper Music外,還包括洛杉磯的Popgun、倫敦的Jukedeck和AI Musical、舊金山的Humtap、柏林的Melodrive、Google總部山景城的Groov.A、盧森堡的AIVA、非盈利性研究公司OpenAI以及自稱為 “首個建立在人工智慧音樂發現基礎上的全方位服務唱片公司”Snafu Records等。其中,Jukedeck已於2019年7月被位元組跳動收購。

而在國內,AI音樂也有不少的行業實踐。

除了百度、騰訊、阿里、網易雲等音樂平臺都在不同程度上對AI音樂有佈局外,高校以及大中型企業也逐漸加入到AI音樂的教育、研發中。

例如,貌似和音樂搭不上邊的平安科技有限公司,接連與中央民族大學、四川音樂學院等高校展開了合作,並在2018年EPFL瑞士聯邦理工學院舉辦的AI作曲國際挑戰賽中,贏得了智慧作曲領域內首次的AI世界作曲大賽冠軍。

而由微軟(亞洲)網際網路工程院人工智慧創造力團隊負責研發的AI音樂技術,已經能夠基於和絃、節奏、旋律交叉等多項音樂元素進行內容創作,集作曲、作詞、編曲、演唱等多項音樂創作力於一體,相當於一支完整樂隊。

如今,此項技術已在央視及各省市綜藝節目中多次驗證,併成功實現了商業化與產業化輸出。2018年5月,微軟宣佈公司旗下人工智慧小冰已經掌握了歌詞創作和譜曲能力。

另外,2018年4月,嗨翻屋釋出的音樂AI創作助手“小嗨”在目前已經創作了數張專輯,除了作詞作曲,還具備“識曲”功能。

而2019 年2月、3 月分別在 IOS 和安卓上線的“鯨鳴”APP,則是一款可以讓普通人的“線上合唱”變為可能的音樂類應用。“鯨鳴”APP使用的是 AI 歌聲合成技術,使用者只需要錄入自己的聲音,APP便可自動修音,並利用 AI 技術將錄音者的聲音與原唱或者是其他使用者的音色相結合,最終達成合唱效果。

不難發現,AI在音樂領域的運用已經是各文化產業的一大重點。在快速發展的同時雖然也存在一定的困境。當然,主要還是圍繞演算法、版權兩個方面。但隨著AI整體技術水平的提升,使用者對作曲系統智慧化程度要求的提高,AI在音樂領域的運用正逐步走出困境,國內發展的趨勢也逐漸與國際接軌。

首先,在演算法技術層面,混合型演算法以及個性化智慧音樂定製依然是主流。一方面,由於各種演算法在人工智慧作曲的使用中都有其自身的優勢和不足,目前人工智慧作曲的音樂作品風格和體裁比較單一,且可聽性不強。在混合型的演算法作曲中,各種演算法將揚長避短,這些問題能夠得到有效解決。

另一方面,由於AI作曲從大資料中抽取規則,多產但很容易造成歌曲同質性較高的問題。但個性化智慧音樂定製以聽眾的私人喜好為前提,通過大資料和演算法運作後生產出的作品也因個體的差異,更具有原創性。

其次,在版權方面,受制於無法破除的法律困境,AI技術轉向與人類音樂人合作將是短期內突破版權的最直接手段;同時,人類音樂人也會在其中獲利,AI技術對於人類創造力以及音樂人靈感的激發作用會越發凸顯。

有報導稱,人機配合的創作方式是人類音樂家創作速度的20倍。某種程度來說,在提升音樂人的工作效率、降低音樂人與製作方的溝通成本方面,AI作曲都有著人類協作難以企及的優勢。

2018年9月,阿里音樂首席科學家堯問(花名)曾在阿里音樂專場論壇上說道:

“我覺得任何一個藝術家,總有創意枯竭的時候,他們需要靈感。AI創作的音樂可能不是整段歌都好聽,但中間恰好有一小段和這些藝術家的情緒相符,藝術家就能參考借鑑,作為靈感的迸發點,把這個啟發轉化到自己的作品裡面去,我覺得這對於他們是非常好的幫助。”

隨著AI技術在深度學習的逐漸深化,對於人類情緒掌握的逐漸熟練,以及法律逐漸完善對計算機作品以及主體的定義,AI作為人類音樂家的輔助工具這一現狀或許也不會持續太久,畢竟技術以及法律都並非是一塵不變的。

從流媒體利用AI進行智慧推薦去引導聽眾音樂品味,到科學家基於AI打造出AI作曲家再一次顛覆音樂行業,人們對於AI的發展有些喜憂參半。

一方面,AI的加入能夠讓音樂行業更加完善,讓這個行業的運作更加有效率;另一方面,作為人類製造出來的機器,AI作曲的銷量和品質也許會讓很多音樂人汗顏。

長遠來看,AI與人類的音樂人、電臺DJ的關係或許也不是非此即彼,就像現在的數字音樂與黑膠的對決一樣,黑膠的沒落是有目共睹,但其價值仍然被大眾認可,甚至被小部分人追捧。

換句話說,技術的進步以及行業的綜合性推進,最大可能會使得AI音樂成為音樂創作的一種標準配置。當然,人們對人類音樂人在音樂上的原創性、審美性要求也會越高。

但無論是AI音樂或者是人類創作的音樂,從音樂誕生到現在花樣百出的音樂產品,其最核心的仍然是提供服務,這個核心不改變,人和音樂的關係也不會被改變。

歸根結底,人工智慧仍來源於人類智慧,與其說讓音樂人失業或者是被遭遇到AlphaGo式的碾壓,不如說是技術帶來的行業變遷,而在作品或音樂服務的選擇上,聽眾也有了更多元化的選擇。

參考資料

  1. 《ARTIFICIAL INTELLIGENCE MADE A SONG IN THE STYLE OF TRAVIS SCOTT. IT SOUNDS UNNERVINGLY LIKE TRAVIS SCOTT.》,《Music Business Worldwide》,2020年2月16日
  2. 《藝術家們是如何看待虛擬現實這一未來大勢的?》,《SIZE潮流生活》,2020年2月16日
  3. 《第一個世界正式的AI作曲家AIVA是怎樣創作音樂的?》,《雷克世界》,2017年3月17日
  4. 《什麼是人工神經網路(ANN)》,《知乎專欄:人工智慧影像識別技術與計算機視覺(CV)》,釋出於2018年8月30日
  5. 李景平:《人工智慧深度介入文化產業的問題及風險防範》,《深圳大學學報(人文社會科學版)》,2019年9月第5期
  6. 貳叄叄 :《AI寫的歌,應該受到版權保護嗎?》,《音樂先聲》,2019年6月14日
  7. 肖欣:《人工智慧生成內容版權問題的國際比較研究》,華東政法大學碩士論文,2019年
  8. 《神經網路最大的優點,以及最嚴重的缺陷》,《csdn人工智慧頭條》,2018年10月12日
  9. 王鉉、雷沁穎:《人工智慧對中國音樂產業鏈的滲透與革新》,《現代傳播(中國傳媒大學學報)》,2019年12期
  10. 《博覽會 | AI音樂家會像阿法狗那樣碾壓人類嗎?》,《中國音樂財經網》,2018年4月24日
  11. 田梅、黃智興、張友剛:《演算法作曲中的人工智慧技術》,《四川教育學院學報》,2006年12月

 



http://www.woshipm.com/ai/3471038.html



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2680372/,如需轉載,請註明出處,否則將追究法律責任。

相關文章