在MoneyPrinterPlus中使用本地chatTTS語音模型

flydean發表於2024-07-16

原文網址 : https://www.cnblogs.com/flydean/p/18304553

TTS模型

之前MoneyPrinterPlus在批次混剪,一鍵AI生成影片這些功能上的語音合成功能都用的是雲廠商的語音服務，比阿里雲，騰訊雲和微軟雲。

雲廠商雖然提供了優質的語音服務，但是用起來還是要收費。

為了各位小夥伴的錢包，現在特意給MoneyPrinterPlus上線了本地chatTTS語音服務。

趕緊來體驗吧。

軟體準備

當然，前提條件就是你需要下載MoneyPrinterPlus軟體啦。

下載地址： https://github.com/ddean2009/MoneyPrinterPlus

用得好的朋友，不妨給個star支援一下。在軟體v4.0版本之後，MoneyPrinterPlus已經全面開始支援本地模型。

安裝chatTTS

我們可以直接從chatTTS的官網上 https://github.com/2noise/ChatTTS 下載chatTTS的原始碼：

git clone https://github.com/2noise/ChatTTS
cd ChatTTS

安裝依賴：

pip install --upgrade -r requirements.txt

執行web-UI：

python examples/web/webui.py

執行api-server:

fastapi dev examples/api/main.py --host 0.0.0.0 --port 8000

這裡注意，web-ui的預設埠是8080， api-server的埠是8000。

MoneyPrinterPlus需要連線的是8000埠的api-server。

web-UI只是為了展示怎麼配置音色的一個展示用的。

我們開啟 http://localhost:8080/ 可以看到類似下面的頁面：

點選生成按鈕，如果能夠成功合成音訊檔案，那麼說明你的chatTTS安裝成功了。

在MoneyPrinterPlus中使用ChatTTS

回到MoneyPrinterPlus，我們啟動MoneyPrinterPlus，在基本配置頁面我們可以看到:本地語音TTS的選項。

這裡我們選擇chatTTS，並且設定chatTTS api server的地址。

上面我們是以8000啟動的api server，所以這裡我們就輸入：http://127.0.0.1:8000/。

接下來點選影片混剪區，在影片配音區選擇本地模型：

我們可以得到下面的介面：

解釋一下各個引數的作用：

是否口語化對應chatTTS的口語化開關，如果啟動口語化，chatTTS會自動對輸入的文案進行口語化調整。所以預設是不開啟的。

Text Seed是控制口語化模型處理的種子，你可以隨意調整。

Audio Temperature控制音訊情感波動性，範圍為 0-1，數字越大，波動性越大

top_P ：控制音訊的情感相關性，範圍為 0.1-0.9，數字越大，相關性越高

top_K ：控制音訊的情感相似性，範圍為 1-20，數字越小，相似性越高

Refine text Prompt是指在口語化過程中新增的一些引數。如果不懂的話可以不修改。

本地chatTTS音色目錄，預設在專案的chattts目錄中。

現在我在chattts目錄中預先放置了2種音色檔案。

一種是txt檔案，一種是pt檔案。

你可以自行新增更多的音色檔案到chattts目錄中。

那麼有小夥伴要問了，txt或者pt檔案是怎麼來的呢？

先講一個簡單的pt檔案，你可以在 https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker 這個空間中試聽和下載對應的語音檔案：

把下載下來的pt檔案，放在MoneyPrinterPlus中的chattts目錄即可。

txt檔案是怎麼來的呢？

我們再次回到chatTTS的webUI介面：

這個txt就是這裡的Speaker Embedding的內容。

你可以點選右上角的複製按鈕，新建一個utf-8編碼的txt檔案。把這個txt檔案放到MoneyPrinterPlus中的chattts目錄即可。

如果你不想用已有的音色檔案，那麼可以點選使用隨機聲音按鈕：

會出現一個Audio Seed選項，這個seed就是用來控制Audio音色的。

有了這些配置之後，點選試聽聲音，如果能聽到聲音就說明你的chatTTS在MoneyPrinterPlus中配置成功了。

接下來就可以使用本地的chatTTS來合成語音啦。

點我檢視更多精彩內容:www.flydean.com

MoneyPrinterPlus全面支援本地Ollama大模型
2024-07-15
大模型
Python 潮流週刊#54：ChatTTS 強大的文字生成語音模型
2024-06-08
PythonTTS模型
AI語音：ChatTTS 真有點東西啊！
2024-06-05
AITTS
在本地跑一個大語言模型
2024-04-02
模型
本地部署FastGPT使用線上大語言模型
2024-03-08
ASTGPT模型
ChatTTS,語氣韻律媲美真人的開源TTS模型,文字轉語音界的新魁首,對標微軟Azure-tts
2024-05-31
TTS模型微軟
使用純c#在本地部署多模態模型，讓本地模型也可以理解影像
2024-04-19
C#模型
GPUStack v0.4：文生圖模型、語音模型、推理引擎版本管理、離線支援和部署本地模型
2024-12-09
GPU模型
語音識別模型
2024-10-29
模型
在本地跑一個大語言模型(2) - 給模型提供外部知識庫
2024-04-02
模型
ChatTTS的兩種使用方式
2024-10-07
TTS
黃碩：百度飛槳文心大模型在語音文字稽核中的應用
2022-06-17
大模型
在Mac中如何啟用語音輸入功能？
2021-11-04
Mac
ChatTTS：Win11本地安裝和一鍵執行包!
2024-06-05
TTS
蘋果將使用本地大模型？
2024-04-23
蘋果大模型
本地大模型LocalAI使用教程指南
2024-03-24
大模型AI
使用ollama玩轉本地大模型
2024-03-19
大模型
海南話語音識別模型——模型訓練(一)
2024-11-02
模型
爆火ChatTTS突破開源語音天花板，3天斬獲9k的Star量
2024-05-31
TTS
在 Unity 多人遊戲中實現語音對話
2019-04-03
Unity遊戲
CosyVoice多語言、音色和情感控制模型，one-shot零樣本語音克隆模型本地部署(Win/Mac),通義實驗室開源
2024-07-07
模型Mac
goto 語法在 PHP 中的使用
2020-09-16
GoPHP
新一代 Kaldi: 支援 JavaScript 進行本地語音識別和語音合成啦！
2024-03-17
JavaScript
用python呼叫百度語音識別api批量處理本地語音檔案
2020-11-08
PythonAPI
語義模型在智慧工業運營中的作用
2021-12-27
模型
GPT-SoVITS語音合成模型實踐
2024-09-29
GPT模型
相簿或者多圖在文件模型中的使用
2019-05-11
模型
通用模型、全新框架，WavLM語音預訓練模型全解
2021-12-27
模型框架
使用open webui+ollama部署本地大模型
2024-04-25
WebUI大模型
低延遲流式語音識別技術在人機語音互動場景中的實踐
2023-04-14
小林同學智慧AI大模型語音助手
2024-07-12
AI大模型
SemanticKernel/C#：使用Ollama中的對話模型與嵌入模型用於本地離線場景
2024-08-02
C#模型
LM Studio + open-webui 快速本地部署大語言模型
2024-07-22
WebUI模型
GPT大語言模型Alpaca-lora本地化部署實踐【大語言模型實踐一】
2023-05-17
GPT模型
使用本地大語言模型和Langchain手搓免費的AI搜尋問答助手
2024-05-23
模型LangChain
小白Windows下透過Ollama部署使用本地模型
2024-03-12
Windows模型
android 使用 SoundPool 語音播報
2021-08-18
Android
帶你瞭解大語音模型的前世今生
2023-11-27
模型

在MoneyPrinterPlus中使用本地chatTTS語音模型

軟體準備

安裝chatTTS

在MoneyPrinterPlus中使用ChatTTS

相關文章