音樂ChatGPT時刻來臨!「天工SkyMusic」音樂大模型今日啟動邀測

机器之心發表於2024-04-02
4 月 2 日,崑崙萬維 AI 音樂生成大模型「天工 SkyMusic」即日起面向社會開啟免費邀測

本輪邀測將開放 1000 個免費名額,面向行業媒體、專家、以及感興趣的音樂從業者開放,使用者可掃描文後二維碼或透過網頁填寫申請,收到申請表後工作人員將第一時間聯絡回覆。「天工 SkyMusic」正式版也將在 4 月 17 日隨「天工 3.0」面向全社會免費開放。

申請網頁:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md

「天工 SkyMusic」基於崑崙萬維「天工 3.0」超級大模型打造,是目前國內唯一公開可用的 AI 音樂生成大模型

在通往 AGI 的道路上,多數團隊都專注於模型智力的擴充套件和增強,幾乎沒有人關注 AI 如何幫助人們理解和更好地表達情感。智力固然重要,但情感是我們能夠被稱之為人的關鍵,於是,情感 AGI 成為崑崙天工探索研究的一個重要方

我們發現相比文字和圖片,音訊內容是理解人類情感最好的方式,而音樂又是人類情感表達最充沛、最不受地域和文化限制的內容載體,不論時代變幻,不論是戰爭還是災禍,人們總是能透過音樂傳遞自己的感受並獲得情感的慰藉。於是我們創造了音樂音訊大模型「天工 SkyMusic」,並在公司內部測試中已經獲得了非常好的反饋和表現,很高興跟大家宣佈:即日起天工音樂開放媒體與行業專家內測,來體驗人聲情感表達 SOTA 的音樂大模型產品。生成作品效果如下:音樂ChatGPT時刻來臨!「天工SkyMusic」音樂大模型今日啟動邀測
採用自研類 Sora 模型架構 擁有五大優勢

「天工 SkyMusic」採用音樂音訊領域類 Sora 模型架構,Large-scale Transformer 負責譜曲,來學習 Music Patches 的上下文依賴關係,同時完成音樂可控性;Diffusion Transformer 負責演唱,透過 LDM 讓 Music Patches 被還原成高質量音訊,使得「天工 SkyMusic」能夠支援生成 80 秒 44100Hz 取樣率雙聲道立體聲歌曲。這套模型架構在處理影片、音訊和音樂領域效果極佳。崑崙萬維團隊也將在後續逐步迭代和新增新的能力,讓模型具備多模態的情感理解與表達能力。

圖片

「天工 SkyMusic」具有以下五大特點:

1. 高質量 AI 音樂

「天工 SkyMusic」能夠生成 80 秒 44100Hz 取樣率雙聲道立體聲 AI 歌曲,並可根據使用者輸入的歌詞風格生成對應歌曲風格。

2. 人聲 “以假亂真”

人聲合成是 AI 音樂生成中最重要、最能體現生成效果和品質的維度。「天工 SkyMusic」的 AI 人聲合成能夠達到業內頂尖的 SOTA 水平,中文水平極為優秀,發音清晰、無異響。其中文演唱效果更是顯著好於國外產品,領先世界水平。

3. 歌詞段落控制

「天工 SkyMusic」能夠透過歌詞來控制歌曲,讓生成的歌曲可以明確分辨出不同歌詞段落的情緒變化,體現出主歌和副歌、前奏和主歌的段落差異。

4. 多種音樂風格

「天工 SkyMusic」支援說唱、民謠、放克、古風、電子等多種音樂風格,使用者在創作音樂時,可以透過參考音訊制定想要的音樂風格。音樂ChatGPT時刻來臨!「天工SkyMusic」音樂大模型今日啟動邀測
5. 音樂智慧表達 - 歌唱技巧學習

「天工 SkyMusic」同時能夠學習如顫音、歌劇、吟唱、男女對唱,自動和聲等多種歌唱技巧,讓使用者創作的歌曲得到更恰當的情感表達。音樂ChatGPT時刻來臨!「天工SkyMusic」音樂大模型今日啟動邀測
一直以來,AI 音樂生成大模型都是 AI 大模型行業最受關注的落地應用之一。早在 2022 年 12 月,崑崙萬維就釋出了「崑崙天工」AIGC 全系列開源演算法與模型,其中就包括多模態音樂內容生成大模型。此後,崑崙萬維更是透過 AI 音樂生成大模型為北京市東城區域文商旅融合品牌 “故宮以東” 打造了年度數字主題曲,將 AI 音樂前沿科技與東城區歷史文化深度融合。

今天面向社會開啟免費邀測的「天工 SkyMusic」更是國內首款、同時也是目前國內唯一公開可用的 AI 音樂生成大模型

2023 年,崑崙萬維在 “All in AGI 和 AIGC” 的戰略推動下,在人工智慧領域取得了許多進展,逐步形成了 AI 大模型、AI 搜尋、AI 音樂、AI漫畫、AI社交、AI 遊戲等 AI 業務矩陣。

崑崙萬維創始人周亞輝表示:“未來三十年,人類社會將從感知線,變成表達線,整個人類社會在自我表達側要翻 1000 倍;創作和自我表達是未來 30 年在整個社交和文化領域增長最快的曲線,會有越來越多人表達自我,表達對世界的理解、對社會事物的態度,表達越來越藝術化和趣味化;這種表達在過去很困難,因為工具門檻高,而未來 30 年是自我表達的 30 年,我們要用 AI 把人類創作的門檻降得足夠低,讓人們更充分地實現自我表達。”

2024 年,崑崙萬維釋出全新公司使命:“實現通用人工智慧,讓每個人更好地塑造和表達自我”。

這一使命體現了技術創新與人文關懷的結合,旨在創造一個每個人都能夠自由地發揮自己最大潛力的未來。透過通用人工智慧,崑崙萬維希望構建一個更加智慧、更加互聯、更加理解和尊重每個人個性的世界。

音樂,將會是其中的重要環節。

透過「天工 SkyMusic」,崑崙萬維希望幫助每一個人更好地創作音樂,表達情感。

當前,崑崙萬維已打造了集 AI 搜尋、AI 寫作、AI 長文字閱讀、AI 對話、AI 語音合成、AI 圖片生成、AI 漫畫創作、AI 圖片識別、AI 音樂生成、AI 程式碼寫作、AI 表格生成等多項能力於一體的「天工 3.0」多模態 “超級模型”(Super Model),成為 AI 行業全新里程碑。

本輪「天工 SkyMusic」邀測將開放 1000 個免費名額,面向行業媒體、專家、以及感興趣的音樂從業者開放。歡迎掃碼或透過透過網頁填寫以下報名表,崑崙萬維工作人員將在第一時間聯絡回覆。未申請邀測的使用者也可在 4 月 17 日免費下載最新版 “天工 AI 智慧助手” APP,感受「天工 3.0」與「SkyMusic」帶來的顛覆性 AI 體驗

圖片

申請網頁:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md

相關文章