i人的福音!一個強大開源的文字轉語音工具!

Java陈序员發表於2024-07-22

大家好,我是 Java陳序員

現在的自媒體可謂是十分火熱,各個影片剪輯軟體提供了文字生成語音的功能,但大多都是千篇一律的音色,比如“這個男人叫小帥”。

如果你想做自媒體,既不想錄制自己的語音,又想自己的影片配音與他人不同,可以考慮使用大模型來訓練生成自己的語音。

今天,給大家介紹一個開源免費的文字轉語音工具,支援十幾種語言生成!

關注微信公眾號:【Java陳序員】,獲取開源專案分享、AI副業分享、超200本經典計算機電子書籍等。

專案介紹

EmotiVoice —— 一個強大的開源 TTS 引擎(Text To Speech,即文字轉語音),完全免費開源!

EmotiVoice 供了一個易於使用的 Web 介面用於文字轉語音,支援中英文雙語,包含 2000 多種不同的音色,以及特色的情感合成功能,支援合成包含快樂、興奮、悲傷、憤怒等廣泛情感的語音。

此外,EmotiVoice 還提供了用於批次生成結果的 API 介面。

專案使用

啟動工具

EmotiVoice 的使用方法十分簡單,在 Windows 環境下,解壓軟體壓縮包後,雙擊執行 start.bat 即可啟動。

雙擊執行 start.bat 後,將會在 CMD 命令視窗中執行服務:

並在瀏覽器中自動開啟 Web 介面:

單句合成

1、選擇說話人,工具提供了十幾種不同的男女音色供選擇

2、選擇情緒,工具提供了普通、生氣、開心、驚訝、悲傷、厭惡、恐懼等語音情緒

3、輸入合成文字

4、點選合成

5、合成的音訊可以進行線上播放和下載,或者在合成時勾選生成音訊後直接儲存在wav_file目錄下

故事劇本多人合成

EmotiVoice 除了提供單句合成,還提供了故事劇本多人合成的功能。

1、輸入角色和文字

2、為角色選定聲音情感

3、為角色選定配音員

4、點選合成音訊

快速上手

完整安裝

conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio
pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict

更多的模型訓練,可參考專案文件。

Docker 部署

嘗試 EmotiVoice 最簡單的方法是執行 Docker 映象,需要一臺帶有 NVidia GPU 的機器!

docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

容器啟動成功後,訪問:

http://localhost:8501/

EmotiVoice 作為一款 TTS 引擎,可以說功能十分強大,而且開源免費,大家快去圍觀體驗吧~

專案地址:https://github.com/netease-youdao/EmotiVoice

最後

推薦的開源專案已經收錄到 GitHub 專案,歡迎 Star

https://github.com/chenyl8848/great-open-source-project

或者訪問網站,進行線上瀏覽:

https://chencoding.top:8090/#/

大家的點贊、收藏和評論都是對作者的支援,如文章對你有幫助還請點贊轉發支援下,謝謝!

相關文章