語音合成之王ElevenLabs攪局音樂界,新模型創作水準堪馳援《歌手》

机器之能發表於2024-05-13

機器之能報導

編輯:Cardinal

一個簡單提示,二十幾個詞,就能生成一首三分時長的歌曲,其水準足以打榜。

很多人制作影片時,喜歡強強聯合——用 Suno、Udio 生成背景音樂,ElevenLabs 負責旁白。前者是逼真的 AI 音樂創作工具,ElevenLabs 則是目前最著名、最好的 AI 聲音生成平臺之一。

但現在,格局要生變了。

最近,ElevenLabs 又推出一款新型 AI 音樂生成器,進軍音樂界。聽聞音訊之王也要「通吃」音樂之王,很多人的反應都在演我:

圖片

圖片

ElevenLabs 在 X 上展示了新模型創作的一些曲目—— 只需 20 幾個單詞提示就能將你的想法轉化為一首歌,「所有歌曲都是從單個文字提示生成的,無需編輯。」

這些官方釋出的示例作品至少有 2 分鐘時長,有的接近 3 分鐘,歌手聲音聽起來很自然,歌曲風格包括爵士樂、流行音樂、迴響貝斯( dubstep )和鄉村音樂等,歌詞也是系統生成。

音樂模型目前處於早期預覽階段,只有 ElevenLabs 工作人員可以訪問。如果示例中的時長(比如三分鐘)就是新模型預設的生成長度,這將會是一個巨大進步——這比 Udio 的 30 秒或 Suno 的 1 分鐘要長得多,也意味著一個簡單提示就能生成一首完整歌曲,不再需要後續擴充套件。

這是六首由新音樂模型創作的歌曲:

1、歌名:It Started to Sing ( Jazz Version ) ( 2 分 59 秒 )

提示:A jazz pop top charts song with emotional vocals, catchy chorus, and trumpet solos

提示:這是一首登上流行音樂榜單榜首的爵士流行樂,歌手歌唱動人,副歌朗朗上口,還有醒目的小號獨奏。

語音合成之王ElevenLabs攪局音樂界,新模型創作水準堪馳援《歌手》

影片連結:https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ

2、歌名:Broke my Heart ( 2 分 50 秒)

提示: Smooth Contemporary R&B with subtle Electronic elements, featuring a pulsing 104 BPM drum machine beat, filtered synths, lush electric piano, and soaring strings, with an intimate mood.

提示:這是一段具有當代 R&B 風格的歌曲,節奏平穩流暢同時又巧妙地融入了一些電子元素。音樂以 104 BPM 的鼓點為基礎,鼓點有力而富有律動感。歌曲中使用了濾波合成器營造氛圍,電子鋼琴旋律優美動聽,絃樂恢弘大氣,整體氛圍溫馨親密。

語音合成之王ElevenLabs攪局音樂界,新模型創作水準堪馳援《歌手》

影片連結:https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ

3、歌名: My Love ( 3 分 01 秒)

提示:Indie Rock with 90s influences, featuring a combination of clean and distorted guitars, driving drum beats, and a prominent bassline, with a moderate tempo around 120 BPM, and a mix of introspective and uplifting moods, evoking a sense of nostalgia and hope。

提示:這是一首融合了獨立搖滾和 90 年代風格的歌曲,音樂中清音吉他和失真吉他相互交織,鼓點強勁有力,推動著歌曲的節奏,同時低音貝斯也非常突出。歌曲節奏適中,約在 120 BPM 左右。整首歌的情緒時而沉思內省,時而振奮人心,喚起了一種懷舊和充滿希望的感覺。

語音合成之王ElevenLabs攪局音樂界,新模型創作水準堪馳援《歌手》

影片連結:https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ

圖片


網友聽完後的感嘆


4、這是員工分享的一個作品,歌名:never stopping to learn。

一句非常簡單的提示:rap about never stopping to learn(這是一段有關學無止境的說唱),就生成了這首 3 分 10 秒長的歌曲。

語音合成之王ElevenLabs攪局音樂界,新模型創作水準堪馳援《歌手》

影片連結:https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ

ElevenLabs 員工還放出了另外兩首作品,一個是說唱,一個是迴響貝斯( Dubstep )曲風。不過,時長都只有 1 分多鐘。

語音合成之王ElevenLabs攪局音樂界,新模型創作水準堪馳援《歌手》


語音合成之王ElevenLabs攪局音樂界,新模型創作水準堪馳援《歌手》

影片連結:https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ


英國音樂製作人 Beardyman 轉發了上面這首 dubstep ,稱 「 三年內幾乎不可能以商業音樂為生。」


圖片


AI 音樂是今年迄今為止增長最快的合成內容領域之一,第一首 Suno 歌曲的收聽量突破了一百萬次,Udio 也推出了非常逼真的 AI 音樂創作工具。著名的科技媒體 tomsguide 評價認為,這些迄今為止共享的樣本表明,ElevenLabs 新模型的創作質量在多種歌曲流派上都超過了另一個炙手可熱的音樂生成器 Udio 。
比 suno、udio 要好得多,有網友表示:

圖片


圖片


「這是我聽過的最令人印象深刻的 AI 生成的音樂:其他 AI 音樂生成工具聽起來相當機器人和人工。這感覺就像是一個真正的飛躍。」


圖片


更便宜、更富有表現力的聲音,這就是我們想要的。


圖片

ElevenLabs 以其自然的合成聲音和令人印象深刻的準確語音克隆而聞名,進軍音樂生成之前,他們也在佈局 AI 音效——允許使用者透過相對簡單的提示建立一些複雜、多層次聲音效果。例如動物叫聲、噼啪作響的篝火聲、海浪、雷暴、風鈴伴隨老式的火車汽笛聲。接下來涉足音樂工具,似乎也在邏輯之中:
聲音正成為生成 AI 的一個快速增長領域,因為它為視覺創作提供了純文字無法企及的新的體驗維度,而克隆、合成語音只是聲音的一部分,連同音樂工具、聲效甚至自定義噪音一起就能比較完整地為創作者、觀眾,提供一種全新、也更身臨其境的敘事和體驗方式。

參考連結

https://twitter.com/elevenlabsio/status/1788628171044053386

相關文章