VALL-EX下載介紹:只需3秒錄音,即可克隆你的聲音

老艾的AI世界發表於2024-06-01

VALL-EX是一個強大創新的多語言文字轉語音模型,支援對中文、英文和日語的語音進行合成和克隆,使用者只需上傳一段3-10秒的錄音,就可以生成高質量的目標音訊,同時保留了說話人的聲音、情感和聲學環境

VALL-EX的應用範圍非常廣泛,可以用於跨語言文字到語音、語音合成和語音到語音翻譯等各種任務,無論是商業用途還是個人使用VALL-EX都可以幫助使用者輕鬆地進行跨語言交流和文字轉語音任務

VALL-EX最新中文版:

百度網盤:https://pan.baidu.com/s/1ueUFZyaohxwBA7TgLxi2zg?pwd=sb4g

功能特點

· 多語言TTS:以三種語言(英語、中文和日語)說話,具有自然且富有表現力的語音合成

· 零樣本語音克隆:使用3-10秒短音訊,就可以訓練模型,提取出音色

· 語音情感控制:能合成與給定說話人錄音相同情感的語音

· 零樣本跨語言語音合成:可以合成與給定說話人母語不同的另一種語言的語音

· 口音控制:允許嘗試不同的口音,例如用英語口音說中文,反之亦然

· 聲學環境保留:適應輸入的聲學環境,使語音生成感覺自然且身臨其境

使用說明

1.上傳音訊片段

2.引用音訊片段並生成情感模型

3.輸入待合成語音的文字內容

4.選擇語言和口音

5.點選生成按鈕

生成的聲音是基於上傳的語音檔案訓練所得,建議多生成幾次,選擇效果最好的使用

語音合成完畢會在控制檯中輸出資訊:VALL-E EOS,可以在輸出音訊介面播放和下載合成後的語音

注意事項

①專案安裝路徑不要包含中文

②使用過程中若不慎關閉軟體後臺,請重新開啟,並重新整理網頁

相關文章