Windows部署語音轉文字專案_Whisper
Windows部署語音轉文字專案_Whisper
一、前置安裝準備
Github源倉庫,Whisper
- 下載安裝whisper及其依賴項
官方有兩種部署方法,一種是透過預設pip源拉取安裝:
以管理員身份執行powershell,輸入如下命令
pip install -U openai-whisper
因國內網路環境問題,pip下載緩慢,可以透過國內映象源加速下載,使用方法:
pip install PACKAGE -i 國內源地址
例如使用清華源加速下載:國內常用映象源: 清華源:https://pypi.tuna.tsinghua.edu.cn/simple (速度與完成度均優,推薦) 阿里源:https://mirrors.aliyun.com/pypi/simple/ 網易源:https://mirrors.163.com/pypi/simple/ 豆瓣源:https://pypi.douban.com/simple/ 百度雲源:https://mirror.baidu.com/pypi/simple/
pip install -U openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple
另一種方法透過從github倉庫拉取原始碼安裝:
pip install git+https://github.com/openai/whisper.git
等待下載安裝完成。
若安裝成功,在powershell中輸入whisper
將得到以下輸出:
- 安裝chocolatey
安裝chocolatey是為了方便後續在Windows中安裝ffmpeg
繼續在powershell中輸入如下命令:
Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))
在安裝完成後,根據提示重啟powershell,可輸入choco
檢查是否成功安裝:
- 安裝ffmpeg
在以管理員身份執行的powershell中輸入命令進行安裝ffmpeg:
choco install ffmpeg
安裝完成後在powershell中輸入ffmpeg
將得到以下輸出:
- NOTE
在官方文件中提到若在上述安裝過程中報錯還須安裝rust
,安裝命令如下:
pip install setuptools-rust
本文此前已完成安裝
二、使用Whisper
可以透過命令列呼叫Whisper:
whisper AUDIO.mp3 --model MODEL_TYPE
即,whisper 路徑+檔名 --model 呼叫模型名稱
使用例子:
whisper D:/downloads/ted演講.mp4 --model tiny
whisper有五種不同的模型,詳細開銷和執行速度如下圖表所示:
首次使用模型需要下載,若出現報錯Error 10054
程式碼,則說明網路環境出現問題,進行全域性代理再次執行命令下載模型即可。
此外,也可以指定語言識別輸出:
whisper AUDIO.mp3 --model MODEL_TYPE --language Chinese