Windows部署語音轉文字專案_Whisper

zbyisgudi發表於2024-07-04

whisper.png

一、前置安裝準備

Github源倉庫,Whisper

  1. 下載安裝whisper及其依賴項
    官方有兩種部署方法,一種是透過預設pip源拉取安裝:
    以管理員身份執行powershell,輸入如下命令
    pip install -U openai-whisper
    因國內網路環境問題,pip下載緩慢,可以透過國內映象源加速下載,使用方法:
    pip install PACKAGE -i 國內源地址
    國內常用映象源:  
    清華源:https://pypi.tuna.tsinghua.edu.cn/simple (速度與完成度均優,推薦)  
    阿里源:https://mirrors.aliyun.com/pypi/simple/  
    網易源:https://mirrors.163.com/pypi/simple/  
    豆瓣源:https://pypi.douban.com/simple/  
    百度雲源:https://mirror.baidu.com/pypi/simple/
    
    例如使用清華源加速下載:
    pip install -U openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple
    另一種方法透過從github倉庫拉取原始碼安裝:
    pip install git+https://github.com/openai/whisper.git
    等待下載安裝完成。
    若安裝成功,在powershell中輸入whisper將得到以下輸出:

Whisper安裝完成.png

  1. 安裝chocolatey
    安裝chocolatey是為了方便後續在Windows中安裝ffmpeg
    繼續在powershell中輸入如下命令:
    Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))
    在安裝完成後,根據提示重啟powershell,可輸入choco檢查是否成功安裝:

choco成功安裝.png

  1. 安裝ffmpeg
    在以管理員身份執行的powershell中輸入命令進行安裝ffmpeg:
    choco install ffmpeg
    安裝完成後在powershell中輸入ffmpeg將得到以下輸出:

ffmpeg完成安裝.png

  1. NOTE
    在官方文件中提到若在上述安裝過程中報錯還須安裝rust,安裝命令如下:
    pip install setuptools-rust
    本文此前已完成安裝

二、使用Whisper

可以透過命令列呼叫Whisper:
whisper AUDIO.mp3 --model MODEL_TYPE
即,whisper 路徑+檔名 --model 呼叫模型名稱
使用例子:
whisper D:/downloads/ted演講.mp4 --model tiny
whisper有五種不同的模型,詳細開銷和執行速度如下圖表所示:

whisper模型圖表.png

首次使用模型需要下載,若出現報錯Error 10054程式碼,則說明網路環境出現問題,進行全域性代理再次執行命令下載模型即可。
此外,也可以指定語言識別輸出:
whisper AUDIO.mp3 --model MODEL_TYPE --language Chinese

相關文章