windows11 下使用 modelscope docker環境實現離線語音轉文字

mysgk發表於2023-05-02

原文網址 : https://www.cnblogs.com/mysgk/p/17367389.html

WindowsDocker

昨天看影片我們做了個能對話的AI派蒙，免費給大家玩！

發現阿里有一個語音轉文字的模型(paraformer),之前處理這種需求一直都是直接呼叫服務商提供好的API介面

突然想嘗試一下本地搭建,雖然和直接呼叫API 沒啥區別(都不知道實現細節),但是這是本地化執行,可以在內網環境執行.

因為平常工作主要是java方向,順便記錄一些踩坑歷史.

環境安裝

參考環境安裝
CPU環境映象：

docker pull registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-py37-torch1.11.0-tf1.15.5-1.5.0

GPU環境映象：

docker pull registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.3.0-py37-torch1.11.0-tf1.15.5-1.5.0

啟動映象

下載後執行

cpu:
docker run -d --name cpu1 -v f:\docker:/work -p 9091:9090 -it --rm alicpuenv /bin/bash

gpu:
docker run -d --name gpu1 -v f:\docker:/work -p 9092:9090 --gpus all -it --rm aligpuenv /bin/bash

demo

環境搭建好了,跑示例就簡單了,官網提供了現成的demo

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

inference_pipeline = pipeline(
    task=Tasks.auto_speech_recognition,
    model='damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch')

rec_result = inference_pipeline(audio_in='https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/asr_example_zh.wav')
print(rec_result)

直接建立一個 demo.py 就可以執行.

它這裡會自動從網上下載模型,大概一個多G(只需下載一次),可能有點慢.

經測試, 我的CPU(AMD Ryzen 7 3700X 8-Core Processor 3.60 GHz) 上跑這段程式(5s 左右的音訊)是 700ms 左右,GPU(RTX 2070) 是500ms 左右

ps: 當然官網也提供了線上的 notebook 可以直接執行,想體驗的同學可以直接線上執行.

如果GPU環境報錯

docker: Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli: mount error: file creation failed: /var/lib/docker/overlay2/76aebda714a598487d6ec2615bfbc8729722e3138a846830a407d07f929128c4/merged/usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1: file exists: unknown.
ERRO[0000] error waiting for container:

可以參考 https://blog.51cto.com/u_15642578/6178468

大概步驟

先不掛載gpu, 直接進入容器, 備份兩個檔案

docker run   -it --rm aligpuenv /bin/bash
mv /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1  /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1.bak
mv /usr/lib/x86_64-linux-gnu/libcuda.so.1  /usr/lib/x86_64-linux-gnu/libcuda.so.1.bak

提交映象修改

docker commit  xxxxxxxxxx aligpuenv

執行新映象

docker run -d --name gpu1 -v f:\docker:/work -p 9092:9090 --gpus all -it --rm aligpuenv /bin/bash

Premiere Pro 2022離線語音轉文字教程，圖文！
2022-03-10
REM
語音轉文字工具，語音轉文字怎樣轉？
2019-06-12
Docker 驗證 Centos7.2 離線安裝 Docker 環境
2019-02-16
DockerCentOS
快速實現語音轉文字，還自帶翻譯
2019-06-25
windows11 下搭建 Docker 開發環境記錄（少踩坑版）
2023-08-30
WindowsDocker開發環境
前端語音轉文字實踐總結
2022-05-19
前端
Window離線環境下如何安裝pyhanlp
2019-03-08
HanLP
（轉）Windows下安裝Docker, GitBash環境配置
2020-10-02
WindowsDockerGit
JS實現將文字轉換為語音並自動播放
2022-06-22
JS
iOS---語音轉文字
2018-05-26
iOS
chrome語音文字互轉
2024-11-04
Chrome
[WPF] 離線環境實現支援拼音模糊搜尋的AutoCompleteBox
2024-07-24
Linux 下使用 Docker 安裝lnmp環境
2021-05-14
LinuxDockerLNMP
離線部署Python環境
2024-10-29
Python
如何用Python語音合成，以及文字轉語音~
2022-09-23
Python
aardio實現語音閱讀文字【包含選擇語音庫】
2024-08-02
[js常用]文字轉化成語音
2018-12-01
JS
Linux下離線部署Node環境和前端服務
2018-10-10
Linux前端
linux 開發離線環境下載及安裝
2024-10-25
Linux
docker下LNMP環境搭建
2024-05-13
DockerLNMP
怎麼將錄音轉文字，錄音轉文字助手如何使用
2018-11-29
【自動化】使用PlayWright+代理IP實現多環境隔離
2024-03-04
MySQL Route負載均衡與讀寫分離Docker環境使用
2018-05-02
MySql負載Docker
C# TTS-文字轉語音
2018-03-28
C#TTS
使用docker搭建gitlab環境
2018-04-11
DockerGitlab
使用docker搭建laravel環境
2021-04-04
DockerLaravel
docker環境下安裝tensorflow
2018-08-28
Docker
Linux環境下非root使用者離線安裝Python及相關庫
2018-04-03
LinuxPython
AVFoundation 文字轉語音和音訊錄製播放
2019-04-19
音訊
蘋果手機文字轉語音方法
2019-01-04
蘋果
Windows部署語音轉文字專案_Whisper
2024-07-04
Windows
離線Linux伺服器環境搭建
2024-08-07
Linux伺服器
怎麼離線安裝vue環境
2021-09-11
Vue
使用 Docker 搭建 Laravel 本地環境
2019-03-04
DockerLaravel
docker配置Nvidia環境，使用GPU
2024-04-25
DockerGPU
使用docker快速搭建hive環境
2020-08-07
DockerHive
教你如何使用Docker製作Python環境連線Oracle映象
2022-07-12
DockerPythonOracle
在 docker 環境下 xdebug 斷點
2019-02-22
Docker斷點

windows11 下使用 modelscope docker環境 實現 離線語音轉文字

環境安裝

啟動映象

demo

如果GPU環境報錯

相關文章

windows11 下使用 modelscope docker環境實現離線語音轉文字