PocketSphinx語音識別系統的安裝和使用
環境: Ubuntu 12.4
CMUSphinx語音識別工具包下載
下載地址如下:由於只是測試使用,故只需要下載Pocketsphinx和Sphinxbase這兩個包,下載檔案如下: pocketsphinx-0.8.tar.gz sphinxbase-0.8.tar.gz
1. 安裝Sphinxbase
tar xvf sphinxbase-0.8.tar.gz
cd sphinxbase-0.8
./configure
sudo make
sudo make install
2. 安裝pocketsphinx
配置Sphinxbase的環境變數
vi ~/.bashrc
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
(這個PKG_CONFIG_PATH主要指明Sphinxbase的.pc檔案的所在路徑,這樣 pkg-config工具就可以根據.pc檔案的內容動態生成編譯和連線選項,比如 cflags(編譯用的標頭檔案)和 libs (連線用的庫))
編譯安裝pocketsphinx:
tar xvf pocketsphinx-0.8.tar.gz
cd pocketsphinx-0.8
./configure
sudo make
sudo make install
3. 測試安裝效果
pocketsphinx_continuous -infile pocketsphinx-0.8/test/data/cards/005.wav > audio.result
查詢識別結果
more audio.result
000000000: eight of states for a close seven of hearts
CMUSphinx語音識別工具包下載
Pocketsphinx —用C語言編寫的輕量級識別庫,主要是進行識別的。
Sphinxbase — Pocketsphinx所需要的支援庫,主要完成的是語音訊號的特徵提取;
Sphinx3 —為語音識別研究用C語言編寫的解碼器
Sphinx4 —為語音識別研究用JAVA語言編寫的解碼器
CMUclmtk —語言模型訓練工具
Sphinxtrain —聲學模型訓練工具
下載地址如下:由於只是測試使用,故只需要下載Pocketsphinx和Sphinxbase這兩個包,下載檔案如下: pocketsphinx-0.8.tar.gz sphinxbase-0.8.tar.gz
1. 安裝Sphinxbase
tar xvf sphinxbase-0.8.tar.gz
cd sphinxbase-0.8
./configure
sudo make
sudo make install
2. 安裝pocketsphinx
配置Sphinxbase的環境變數
vi ~/.bashrc
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
(這個PKG_CONFIG_PATH主要指明Sphinxbase的.pc檔案的所在路徑,這樣 pkg-config工具就可以根據.pc檔案的內容動態生成編譯和連線選項,比如 cflags(編譯用的標頭檔案)和 libs (連線用的庫))
這個設定只對當前系統生效,編輯系統的連結檔案/etc/ld.so.conf去使其長期有效,如下:
sudo vi /etc/ld.so.conf
開啟後,在新的一行新增(每一個路徑一行):
/usr/local/lib
/usr/local/lib/pkgconfig
然後,執行:
sudo ldconfig
編譯安裝pocketsphinx:
tar xvf pocketsphinx-0.8.tar.gz
cd pocketsphinx-0.8
./configure
sudo make
sudo make install
3. 測試安裝效果
pocketsphinx_continuous -infile pocketsphinx-0.8/test/data/cards/005.wav > audio.result
查詢識別結果
more audio.result
000000000: eight of states for a close seven of hearts
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/16582684/viewspace-1243341/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 5 款不錯的開源語音識別/語音文字轉換系統
- 基於語音識別的會議記錄系統
- Windows10系統如何禁用語音識別功能Windows
- ASR-使用whisper語音識別
- JavaScript的語音識別JavaScript
- 語音識別--kaldi環境搭建(基於Ubuntu系統)Ubuntu
- [譯] 使用 WFST 進行語音識別
- 語音識別模型模型
- Linux系統安裝和使用Kafka教程。LinuxKafka
- 二、Linux系統安裝和基本使用Linux
- Kaldi搭建語音識別系統—發音詞典相關檔案準備
- 語音識別技術與政務資訊系統結合
- win10系統下語音識別打不開的解決方法Win10
- 語音識別技術
- 語音情感識別--RNNRNN
- 使用 SpeechT5 進行語音合成、識別和更多功能
- 裝置漏油檢測識別系統 漏油自動識別系統
- Linux系統中nslookup和dig安裝使用Linux
- 中安OCR文字識別系統
- 谷歌承認在偷錄使用者日常對話!為了語音識別系統的開發谷歌
- 工地安全著裝識別系統
- 人員著裝識別系統
- OpenAI 釋出新語音系統「Whisper 」,英文識別能力可接近人類水平OpenAI
- Linux系統上怎麼安裝和使用 exa?Linux
- 樹莓派語音互動--語音輸入識別樹莓派
- 新一代 Kaldi: 支援 JavaScript 進行本地語音識別和語音合成啦!JavaScript
- Swift-語音識別、翻譯Swift
- Python語音識別終極指南Python
- 人工智慧 (08) 語音識別人工智慧
- AI 聲音:數字音訊、語音識別、TTS 簡介與使用示例AI音訊TTS
- 智慧工地安全著裝識別系統
- 怎麼關閉win10語音識別 win10如何關閉電腦的語音識別Win10
- windows10系統如何安裝語音體驗包並修改Windows顯示語言Windows
- 語音活性檢測器py-webrtcvad安裝使用Web
- win10系統語音聲音小怎麼設定 win10系統語音聲音特別小處理方法Win10
- 谷歌再獲語音識別新進展:利用序列轉導來實現多人語音識別和說話人分類谷歌
- 是誰在說話?谷歌多人語音識別新系統錯誤率降至2%谷歌
- 人工智慧之語音識別(ASR)人工智慧
- 百度API---語音識別API