fasterWhisper和MoneyPrinterPlus無縫整合

flydean發表於2024-07-24

MoneyPrinterPlus之前使用的是各種雲廠商的語音識別服務來進行語音的影片和字幕的識別工作。

但是很多小夥伴說雲服務用不起。

那麼沒辦法,MoneyPrinterPlus上線最新版本,支援fasterWhisper本地語音識別模型。

趕緊來體驗吧。

軟體準備

當然,前提條件就是你需要下載MoneyPrinterPlus軟體啦。

下載地址: https://github.com/ddean2009/MoneyPrinterPlus

用得好的朋友,不妨給個star支援一下。 在軟體v4.1版本之後,MoneyPrinterPlus已經支援fasterWhisper本地語音識別模型。

安裝fasterWhipser的模型

fasterWhipser服務直接由MoneyPrinterPlus呼叫。所以不需要第三方的fasterWhisper服務。

但是我們需要下載對應的fasterWhipser模型到MoneyPrinterPlus中。

fasterWhisper模型下載地址:https://huggingface.co/Systran

image-20240724104312078

可以看到裡面有很多種模型,大家可以根據需要自行下載對應的模型。

怎麼下載呢?

進入到MoneyPrinterPlus的fasterwhisper目錄下:

cd fasterwhisper

執行git clone命令:

git clone https://huggingface.co/Systran/faster-whisper-tiny tiny

目前MoneyPrinterPlus支援下面幾種模型名稱:

'large-v3',  'large-v2', 'large-v1', 'distil-large-v3', 'distil-large-v2', 'medium', 'base', 'small', 'tiny'

所以你在git clone的時候,需要把faster-whisper倉庫中的模型目錄重新命名為MoneyPrinterPlus支援的模型名稱。

比如faster-whisper-tiny, 對應的模型叫做tiny,所以我們git clone的時候同時做了重新命名操作:

git clone https://huggingface.co/Systran/faster-whisper-tiny tiny

上面的命令會在本地建立一個tiny的目錄。目錄裡面包含了faster-whisper-tiny的所有模型內容。

在MoneyPrinterPlus中配置faster-whisper

我們啟動MoneyPrinterPlus。

在基本配置區域:

image-20240724104858491

可以配置本地語音識別模型。

model name就是你下載下來的模型名字。

device type 可以選擇cpu,cuda或者auto。

compute type 支援'int8','int8_float16','float16'這幾種型別。

配置好之後,在AI影片區域。

語音識別配置中我們選擇本地模型,即可使用到fasterWhisper了。

image-20240724105725203

同樣的在影片混剪區域,我們也可以選擇本地模型,即可使用到fasterWhisper了。

總結

因為是本地執行的fasterWhisper,所以在執行中可能會出現一些環境的問題。大家可以參考fasterWhisper的說明來解決。

點我檢視更多精彩內容:www.flydean.com

相關文章