再升級!MoneyPrinterPlus整合GPT_SoVITS

flydean發表於2024-08-14

原文網址 : https://www.cnblogs.com/flydean/p/18358780

GPT

最近有很多優秀的語音合成TTS工具，目前MoneyPrinterPlus已經整合了ChatTTS和fasterWhisper。應朋友們的要求，最近MoneyPrinterPlus也整合了GPT_SoVITS這個優秀的語音合成工具。

今天給大家詳細講解一下，如何在MoneyPrinterPlus中使用GPT_SoVITS。

軟體準備

當然，前提條件就是你需要下載MoneyPrinterPlus軟體啦。

下載地址： https://github.com/ddean2009/MoneyPrinterPlus

用得好的朋友，不妨給個star支援一下。在軟體v4.4版本之後，MoneyPrinterPlus已經支援GPT_SoVITS本地TTS語音服務啦。

啟動GPT_SoVITS

GPT_SoVITS這個工具怎麼安裝這裡就不多講了。

我們講下如何跟MoneyPrinterPlus進行合作配置。

GPT_SoVITS有很多功能，包括語音訓練，模型微調，TTS語音推理，變聲等功能。

這裡我們使用的是GPT_SoVITS的核心TTS語音推理功能。

首先我們啟動GPT_SoVITS：

在1-GPT-SoVITS-TTS ---》 1C推理 ---》開啟TTS推理webUI

然後你就可以看到這樣的TTS推理介面：

你可以選擇參考音訊，參考文字，參考音訊的語言。

然後可以輸入要合成的文字，合成語音的類別，語速，top_k, top_p和temperature。

當然，上面的都不重要，我們不需要透過webUI來呼叫GPT_SoVITS，我們需要的是透過API來和GPT_SoVITS進行互動。

API啟動GPT_SoVITS

如果下載的是GPT_SoVITS的集合包，那麼可以直接執行下面的命令來啟動GPT_SoVITS的API：

啟動api: runtime\python.exe api.py

啟動之後，你會看到下面的內容：

上面的啟動是最簡單的啟動，沒有指定參考音訊，如果你想指定參考音訊的話，可以執行下面的命令：

python api.py -dr "123.wav" -dt "一二三。" -dl "zh"

當然，還有其他的一些啟動引數如下：

`-dr` - `預設參考音訊路徑`
`-dt` - `預設參考音訊文字`
`-dl` - `預設參考音訊語種, "中文","英文","日文","韓文","粵語,"zh","en","ja","ko","yue"`

`-d` - `推理裝置, "cuda","cpu"`
`-a` - `繫結地址, 預設"127.0.0.1"`
`-p` - `繫結埠, 預設9880, 可在 config.py 中指定`
`-fp` - `覆蓋 config.py 使用全精度`
`-hp` - `覆蓋 config.py 使用半精度`
`-sm` - `流式返回模式, 預設不啟用, "close","c", "normal","n", "keepalive","k"`
·-mt` - `返回的音訊編碼格式, 流式預設ogg, 非流式預設wav, "wav", "ogg", "aac"`
·-cp` - `文字切分符號設定, 預設為空, 以",.，。"字串的方式傳入`

`-hb` - `cnhubert路徑`
`-b` - `bert路徑`

大家可以根據需要自行選擇。

預設情況下API會啟動在9880埠，我們可以使用下面的命令來測試API的啟動效果：

使用執行引數指定的參考音訊:
GET:
    `http://127.0.0.1:9880?text=先帝創業未半而中道崩殂，今天下三分，益州疲弊，此誠危急存亡之秋也。&text_language=zh`
POST:
```json
{
    "text": "先帝創業未半而中道崩殂，今天下三分，益州疲弊，此誠危急存亡之秋也。",
    "text_language": "zh"
}
```