VALL-EX是一個強大和創新的多語言文字轉語音模型,支援對中文、英文和日語的語音進行合成和克隆,使用者只需上傳一段3-10秒的錄音,就可以生成高質量的目標音訊,同時保留了說話人的聲音、情感和聲學環境
VALL-EX的應用範圍非常廣泛,可以用於跨語言文字到語音、語音合成和語音到語音翻譯等各種任務,無論是商業用途還是個人使用,VALL-EX都可以幫助使用者輕鬆地進行跨語言交流和文字轉語音任務
VALL-EX最新中文版:
百度網盤:https://pan.baidu.com/s/1ueUFZyaohxwBA7TgLxi2zg?pwd=sb4g
功能特點
· 多語言TTS:以三種語言(英語、中文和日語)說話,具有自然且富有表現力的語音合成
· 零樣本語音克隆:使用3-10秒短音訊,就可以訓練模型,提取出音色
· 語音情感控制:能合成與給定說話人錄音相同情感的語音
· 零樣本跨語言語音合成:可以合成與給定說話人母語不同的另一種語言的語音
· 口音控制:允許嘗試不同的口音,例如用英語口音說中文,反之亦然
· 聲學環境保留:適應輸入的聲學環境,使語音生成感覺自然且身臨其境
使用說明
1.上傳音訊片段
2.引用音訊片段並生成情感模型
3.輸入待合成語音的文字內容
4.選擇語言和口音
5.點選生成按鈕
生成的聲音是基於上傳的語音檔案訓練所得,建議多生成幾次,選擇效果最好的使用
語音合成完畢會在控制檯中輸出資訊:VALL-E EOS,可以在輸出音訊介面播放和下載合成後的語音
注意事項
①專案安裝路徑不要包含中文
②使用過程中若不慎關閉軟體後臺,請重新開啟,並重新整理網頁