PocketSphinx語音識別系統的安裝和使用

std1984發表於2014-07-31
環境: Ubuntu 12.4


CMUSphinx語音識別工具包下載


Pocketsphinx —用C語言編寫的輕量級識別庫,主要是進行識別的。

Sphinxbase — Pocketsphinx所需要的支援庫,主要完成的是語音訊號的特徵提取;

Sphinx3 —為語音識別研究用C語言編寫的解碼器

Sphinx4 —為語音識別研究用JAVA語言編寫的解碼器

CMUclmtk —語言模型訓練工具

Sphinxtrain —聲學模型訓練工具

官方地址:
下載地址如下:由於只是測試使用,故只需要下載Pocketsphinx和Sphinxbase這兩個包,下載檔案如下: pocketsphinx-0.8.tar.gz  sphinxbase-0.8.tar.gz

1.  
安裝Sphinxbase

tar xvf sphinxbase-0.8.tar.gz
cd sphinxbase-0.8
./configure
sudo make
sudo make install


2. 安裝pocketsphinx

配置Sphinxbase的環境變數
vi ~/.bashrc
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig         

 (這個PKG_CONFIG_PATH主要指明Sphinxbase的.pc檔案的所在路徑,這樣 pkg-config工具就可以根據.pc檔案的內容動態生成編譯和連線選項,比如 cflags(編譯用的標頭檔案)和 libs (連線用的庫))

這個設定只對當前系統生效,編輯系統的連結檔案/etc/ld.so.conf去使其長期有效,如下:

sudo vi /etc/ld.so.conf

開啟後,在新的一行新增(每一個路徑一行):

/usr/local/lib

/usr/local/lib/pkgconfig

然後,執行:

sudo ldconfig


編譯安裝pocketsphinx:
tar xvf pocketsphinx-0.8.tar.gz
cd pocketsphinx-0.8
./configure
sudo make
sudo make install

3. 測試安裝效果
pocketsphinx_continuous -infile pocketsphinx-0.8/test/data/cards/005.wav > audio.result

查詢識別結果
more audio.result
000000000: eight of states for a close seven of hearts














來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/16582684/viewspace-1243341/,如需轉載,請註明出處,否則將追究法律責任。

相關文章