最近有很多優秀的語音合成TTS工具,目前MoneyPrinterPlus已經整合了ChatTTS和fasterWhisper。應朋友們的要求,最近MoneyPrinterPlus也整合了GPT_SoVITS這個優秀的語音合成工具。
今天給大家詳細講解一下,如何在MoneyPrinterPlus中使用GPT_SoVITS。
軟體準備
當然,前提條件就是你需要下載MoneyPrinterPlus軟體啦。
下載地址: https://github.com/ddean2009/MoneyPrinterPlus
用得好的朋友,不妨給個star支援一下。 在軟體v4.4版本之後,MoneyPrinterPlus已經支援GPT_SoVITS本地TTS語音服務啦。
啟動GPT_SoVITS
GPT_SoVITS這個工具怎麼安裝這裡就不多講了。
我們講下如何跟MoneyPrinterPlus進行合作配置。
GPT_SoVITS有很多功能,包括語音訓練,模型微調,TTS語音推理,變聲等功能。
這裡我們使用的是GPT_SoVITS的核心TTS語音推理功能。
首先我們啟動GPT_SoVITS:
在1-GPT-SoVITS-TTS ---》 1C推理 ---》 開啟TTS推理webUI
然後你就可以看到這樣的TTS推理介面:
你可以選擇參考音訊,參考文字,參考音訊的語言。
然後可以輸入要合成的文字,合成語音的類別,語速,top_k, top_p和temperature。
當然,上面的都不重要,我們不需要透過webUI來呼叫GPT_SoVITS,我們需要的是透過API來和GPT_SoVITS進行互動。
API啟動GPT_SoVITS
如果下載的是GPT_SoVITS的集合包,那麼可以直接執行下面的命令來啟動GPT_SoVITS的API:
啟動api: runtime\python.exe api.py
啟動之後,你會看到下面的內容:
上面的啟動是最簡單的啟動,沒有指定參考音訊,如果你想指定參考音訊的話,可以執行下面的命令:
python api.py -dr "123.wav" -dt "一二三。" -dl "zh"
當然,還有其他的一些啟動引數如下:
`-dr` - `預設參考音訊路徑`
`-dt` - `預設參考音訊文字`
`-dl` - `預設參考音訊語種, "中文","英文","日文","韓文","粵語,"zh","en","ja","ko","yue"`
`-d` - `推理裝置, "cuda","cpu"`
`-a` - `繫結地址, 預設"127.0.0.1"`
`-p` - `繫結埠, 預設9880, 可在 config.py 中指定`
`-fp` - `覆蓋 config.py 使用全精度`
`-hp` - `覆蓋 config.py 使用半精度`
`-sm` - `流式返回模式, 預設不啟用, "close","c", "normal","n", "keepalive","k"`
·-mt` - `返回的音訊編碼格式, 流式預設ogg, 非流式預設wav, "wav", "ogg", "aac"`
·-cp` - `文字切分符號設定, 預設為空, 以",.,。"字串的方式傳入`
`-hb` - `cnhubert路徑`
`-b` - `bert路徑`
大家可以根據需要自行選擇。
預設情況下API會啟動在9880埠,我們可以使用下面的命令來測試API的啟動效果:
使用執行引數指定的參考音訊:
GET:
`http://127.0.0.1:9880?text=先帝創業未半而中道崩殂,今天下三分,益州疲弊,此誠危急存亡之秋也。&text_language=zh`
POST:
```json
{
"text": "先帝創業未半而中道崩殂,今天下三分,益州疲弊,此誠危急存亡之秋也。",
"text_language": "zh"
}
```
配置MoneyPrinterPlus
好了,回到我們的MoneyPrinterPlus頁面。
在基本配置頁面,本地語音TTS,我們選擇GPTSoVITS, 然後輸入GPTSoVITS的地址。
在AI影片或者影片混剪區,在影片TTS語音合成區,我們選擇本地服務。
這裡列出來GPTsoVITS所需要的大部分引數。
你可以使用參考音訊,參考音訊文字,參考音訊語音。
然後可以條件temperature,top_P, top_K等資訊。
點選試聽聲音,如果你聽到合成的聲音,那麼恭喜你,你的配置成功了。
同時,在GPTsoVITS服務的日誌檔案中,你可以看到一些語音合成的進度。
總結
GPTsoVITS是一個非常強大的服務,和MoneyPrinterPlus結合起來使用,你將會無往不利。
點我檢視更多精彩內容:www.flydean.com