教你如何在樹莓派上搭建語音識別服務

會飛行的小蝸牛發表於2016-11-06

樹莓派

最近專案原因需要我完成一個在樹莓派上的離線語音識別，忙活了近一週，起初用了開源的PocketSphinx，但是不得不說，識別率低的驚人，甚至可以說有些字詞根本沒法識別，除非你自己製作聲學模型，不然這玩意兒就是個擺設。

百度目前對像樹莓派這種裝置只支援線上識別，不能用。

最後，萬幸，科大訊飛提供了離線版本，而且還免費，還支援樹莓派！

接下來，根據我的摸索，教大家如何在樹莓派上搭建語音識別模組。

首先，前往訊飛開放平臺下載SDK，平臺選擇Linux。你需要註冊相關資訊，最後你所下載的SDK中會自動填入你的key。

因為科大訊飛官方在新版本SDK移除了樹莓派的支援，我把以前的版本上傳了，供大家使用：
http://download.csdn.net/detail/yanghuan313/9616763

解壓後如圖
這裡寫圖片描述
進入目錄，裡面有如下的檔案：

我們這裡直接選擇進入官方所給的例子進行執行：

關鍵點，因為這個是Linux系統的版本，和樹莓派不一樣，我們需要修改一下庫檔案的引用路徑：
首先，編輯32bit_make.sh:

sudo vim 32bit_make.sh，將內容修改為以下：
這裡寫圖片描述

儲存退出後，繼續，sudo vim Makefile，修改下面劃紅線的位置為如圖：
這裡寫圖片描述

好了，接下來執行source 32bit_make.sh
有可能會出現許可權相關的問題，建議直接從主檔案遞迴給許可權：
sudo chmod -R 774 Linux_voice_1.109

如果出現下面的內容，那就說明沒什麼問題了
這裡寫圖片描述

接著，在Linux_voice_1.109/bin目錄下會生成一個可執行檔案：
這裡寫圖片描述

我們執行它，./iat_sample 正常情況下會顯示
這裡寫圖片描述

這裡選0會直接識別，識別的語音為官方所給的測試語音檔案，儲存在當前目錄的wav資料夾下，識別結果為中美數控。選1則會使用使用者詞表，檔案為當前目錄下的userwords.txt，識別結果為中美速控，原因大家自己思考。
這裡寫圖片描述

好了，現在識別解決了，我們來解決錄音的問題

我試過很多在linux下的錄音軟體，不是不能設定詳細的引數，就是無法控制錄音時間。比如sox，這個軟體很好，但是我看了幫助文件發現，要停止錄音必須手動Ctrl+C！

不過問題還是被我解決了：
sudo apt-get install alsa-oss

安裝完以後，執行：
arecord -d 3 -r 16000 -c 1 -t wav -f S16_LE test.wav

-d : 錄音時間（s）
-r : 頻率
-c : 音軌
-t : 檔案型別
-f : 格式

因為科大訊飛要求單音軌，16000HZ，16bit的取樣，支援wav或者pcm

錄音結束後，檔案儲存在當前目錄，將它移動到bin/wav/下，並且修改檔名替換掉以前的檔案，或者你直接可以在sample/iat_sample/下修改C檔案原始碼。

我們再次執行bin/iat_sample，成功識別。

在這裡我只是講述瞭如何實現語音識別的功能，更多的改善大家可以自己解決。
有錯誤的地方還望大家指正。

樹莓派語音互動--語音輸入識別
2020-11-24
樹莓派
打造DIY版Echo：樹莓派+ Alexa 語音服務
2016-12-26
樹莓派
如何在樹莓派上部署Kubernetes
2017-05-19
樹莓派
如何在樹莓派上執行雷神之錘III
2014-03-06
樹莓派
在樹莓派上搭建智慧家居閘道器
2020-07-15
樹莓派
樹莓派上安裝php
2017-12-12
樹莓派PHP
亞馬遜詳解如何使用MXNet在樹莓派上搭建實時目標識別系統
2017-07-02
亞馬遜樹莓派
樹莓派上配置伺服器
2015-06-02
樹莓派伺服器
【LEDE】樹莓派上玩LEDE終極指南-82-部署OpenVPN服務端
2018-12-26
樹莓派服務端
在樹莓派上安裝 Ubuntu MATE
2019-05-05
樹莓派Ubuntu
在樹莓派上執行 DOS 系統
2018-04-14
樹莓派
在樹莓派上安裝mysql/MariaDB
2017-12-12
樹莓派MySql
OpenYurt 入門 - 在樹莓派上玩轉 OpenYurt
2021-01-06
樹莓派
樹莓派上使用Slowloris進行DDoS攻擊
2018-01-06
樹莓派
樹莓派上使用螞蟻礦機挖礦
2014-06-06
樹莓派
樹莓派上安裝USB網路攝像頭
2018-11-11
樹莓派
在樹莓派上編譯安裝golang環境
2017-10-08
樹莓派編譯Golang
教你如何使用樹莓派搭建區域網監控
2020-08-27
樹莓派
樹莓派使用入門：在樹莓派上使用 Mathematica 進行高階數學運算
2019-04-11
樹莓派
將搭建在樹莓派上的leanote用frp對映到自己的域名
2020-05-25
樹莓派FRP
關於在windows,ubuntu,樹莓派上安裝使用opencv
2020-10-31
WindowsUbuntu樹莓派OpenCV
在樹莓派上安裝go環境很簡單
2017-12-12
樹莓派Go
華為機器學習服務語音識別功能，讓應用繪“聲”繪色
2022-06-24
機器學習
手把手教你使用樹莓派打造一站式監測服務+私有云服務+家庭影音服務（小白向教程）
2021-04-11
樹莓派
樹莓派上安裝2.8寸TFT觸控式螢幕
2014-06-24
樹莓派
在樹莓派上部署yolo模型推理並使用onnx加速
2024-10-03
樹莓派YOLO模型
樹莓派2B架設Typecho服務
2015-10-08
樹莓派
如何在五分鐘內搭建人臉檢測/關鍵點識別等服務?
2018-09-29
Tongue Twister-快速整合華為實時語音識別服務玩轉繞口令
2020-11-28
在樹莓派上設定家庭網路的家長控制功能
2021-03-27
樹莓派
樹莓派上利用Tensorflow實現小車的自動駕駛
2019-01-17
樹莓派自動駕駛
樹莓派上使用DHCPig進行DHCP池耗盡攻擊
2018-01-06
樹莓派
在樹莓派上安裝c++版本的opencv並執行
2024-10-03
樹莓派C++OpenCV
JavaScript的語音識別
2018-08-25
JavaScript
語音識別技術
2018-03-04
語音識別--kaldi環境搭建（基於Ubuntu系統）
2020-01-29
Ubuntu
樹莓派搭建下載機
2021-07-19
樹莓派
樹莓派上使用Pi-FM-RDS工具打造FM調頻電臺
2018-01-06
樹莓派

教你如何在樹莓派上搭建語音識別服務

相關文章