再升級!MoneyPrinterPlus整合GPT_SoVITS

flydean發表於2024-08-14

最近有很多優秀的語音合成TTS工具,目前MoneyPrinterPlus已經整合了ChatTTS和fasterWhisper。應朋友們的要求,最近MoneyPrinterPlus也整合了GPT_SoVITS這個優秀的語音合成工具。

今天給大家詳細講解一下,如何在MoneyPrinterPlus中使用GPT_SoVITS。

軟體準備

當然,前提條件就是你需要下載MoneyPrinterPlus軟體啦。

下載地址: https://github.com/ddean2009/MoneyPrinterPlus

用得好的朋友,不妨給個star支援一下。 在軟體v4.4版本之後,MoneyPrinterPlus已經支援GPT_SoVITS本地TTS語音服務啦。

啟動GPT_SoVITS

GPT_SoVITS這個工具怎麼安裝這裡就不多講了。

我們講下如何跟MoneyPrinterPlus進行合作配置。

GPT_SoVITS有很多功能,包括語音訓練,模型微調,TTS語音推理,變聲等功能。

這裡我們使用的是GPT_SoVITS的核心TTS語音推理功能。

首先我們啟動GPT_SoVITS:

在1-GPT-SoVITS-TTS ---》 1C推理 ---》 開啟TTS推理webUI

image-20240814101451460

然後你就可以看到這樣的TTS推理介面:

image-20240814103843764

你可以選擇參考音訊,參考文字,參考音訊的語言。

然後可以輸入要合成的文字,合成語音的類別,語速,top_k, top_p和temperature。

當然,上面的都不重要,我們不需要透過webUI來呼叫GPT_SoVITS,我們需要的是透過API來和GPT_SoVITS進行互動。

API啟動GPT_SoVITS

如果下載的是GPT_SoVITS的集合包,那麼可以直接執行下面的命令來啟動GPT_SoVITS的API:

啟動api: runtime\python.exe api.py 

啟動之後,你會看到下面的內容:

image-20240814002404640

上面的啟動是最簡單的啟動,沒有指定參考音訊,如果你想指定參考音訊的話,可以執行下面的命令:

python api.py -dr "123.wav" -dt "一二三。" -dl "zh" 

當然,還有其他的一些啟動引數如下:

`-dr` - `預設參考音訊路徑`
`-dt` - `預設參考音訊文字`
`-dl` - `預設參考音訊語種, "中文","英文","日文","韓文","粵語,"zh","en","ja","ko","yue"`

`-d` - `推理裝置, "cuda","cpu"`
`-a` - `繫結地址, 預設"127.0.0.1"`
`-p` - `繫結埠, 預設9880, 可在 config.py 中指定`
`-fp` - `覆蓋 config.py 使用全精度`
`-hp` - `覆蓋 config.py 使用半精度`
`-sm` - `流式返回模式, 預設不啟用, "close","c", "normal","n", "keepalive","k"`
·-mt` - `返回的音訊編碼格式, 流式預設ogg, 非流式預設wav, "wav", "ogg", "aac"`
·-cp` - `文字切分符號設定, 預設為空, 以",.,。"字串的方式傳入`

`-hb` - `cnhubert路徑`
`-b` - `bert路徑`

大家可以根據需要自行選擇。

預設情況下API會啟動在9880埠,我們可以使用下面的命令來測試API的啟動效果:

使用執行引數指定的參考音訊:
GET:
    `http://127.0.0.1:9880?text=先帝創業未半而中道崩殂,今天下三分,益州疲弊,此誠危急存亡之秋也。&text_language=zh`
POST:
```json
{
    "text": "先帝創業未半而中道崩殂,今天下三分,益州疲弊,此誠危急存亡之秋也。",
    "text_language": "zh"
}
```

配置MoneyPrinterPlus

好了,回到我們的MoneyPrinterPlus頁面。

在基本配置頁面,本地語音TTS,我們選擇GPTSoVITS, 然後輸入GPTSoVITS的地址。

image-20240814105434708

在AI影片或者影片混剪區,在影片TTS語音合成區,我們選擇本地服務。

image-20240814002245394

這裡列出來GPTsoVITS所需要的大部分引數。

你可以使用參考音訊,參考音訊文字,參考音訊語音。

然後可以條件temperature,top_P, top_K等資訊。

image-20240814002312805

點選試聽聲音,如果你聽到合成的聲音,那麼恭喜你,你的配置成功了。

同時,在GPTsoVITS服務的日誌檔案中,你可以看到一些語音合成的進度。

image-20240814001906393

總結

GPTsoVITS是一個非常強大的服務,和MoneyPrinterPlus結合起來使用,你將會無往不利。
點我檢視更多精彩內容:www.flydean.com

相關文章