kaldi第一步安裝kaldi測試yesno
Kaldi是一個非常強大的語音識別工具庫,主要由Daniel Povey開發和維護。目前支援GMM-HMM、SGMM-HMM、DNN-HMM等多種語音識別的模型的訓練和預測。其中DNN-HMM中的神經網路還可以由配置檔案自定義,DNN、CNN、TDNN、LSTM以及Bidirectional-LSTM等神經網路結構均可支援。
目前在Github上這個專案依舊非常活躍,可以在 https://github.com/kaldi-asr/kaldi 下載程式碼,以及在 http://kaldi-asr.org/ 檢視它的文件。
下載以及安裝
與其他開源軟體一樣,首先Clone它在Github上的程式碼
$ git clone https://github.com/kaldi-asr/kaldi
1
Clone下來之後按照INSTALL檔案的指示,需要先完成tools資料夾下的編譯安裝,然後再去編譯src下的內容。因此,先去tools資料夾:
$ cd kaldi/tools
在tools資料夾下依舊有一個INSTALL,我們根據它的指示,一步一步完成安裝。首先,需要執行extras/check_dependencies.sh這個指令碼來檢查一些依賴的環境是否存在並且正確配置。
$ extras/check_dependencies.sh
extras/check_dependencies.sh: automake is not installed.
extras/check_dependencies.sh: autoconf is not installed.
extras/check_dependencies.sh: neither libtoolize nor glibtoolize is installed
extras/check_dependencies.sh: subversion is not installed
extras/check_dependencies.sh: we recommend that you run (our best guess):
sudo apt-get install automake autoconf libtool subversion
You should probably do:
sudo apt-get install libatlas3-base
/bin/sh is linked to dash, and currently some of the scripts will not run properly. We recommend to run:
sudo ln -s -f bash /bin/sh
1
2
3
4
5
6
7
8
9
10
11
這個輸出的結果不同的Linux會不相同(我的是Ubuntu 16.04)。根據check_dependencies.sh輸出結果的提示,安裝缺的包,以及配置正確的環境
$ sudo apt-get install automake autoconf libtool subversion
$ sudo apt-get install libatlas3-base
$ sudo ln -s -f bash /bin/sh
1
2
3
然後再重新執行一遍check_dependencies.sh
$ extras/check_dependencies.sh
extras/check_dependencies.sh: all OK.
1
2
如果輸出以上結果,那麼我們可以繼續安裝了
$ make -j 16
1
其中-j 16是開16個job同時進行編譯,這個可以根據CPU核心的數量進行指定。確定沒有錯誤後切換到src資料夾
$ cd ../src
1
這裡面也包含了一個INSTALL檔案,按照裡面的步驟編譯和安裝
$ ./configure
1
執行完成後在最後一行可以看到SUCCESS,如果沒有的話那應該是哪個步驟出問題了,可以去檢查一下上面幾個步驟是否有錯誤
$ make depend
$ make -j 16
1
2
檢查一下編譯是否有錯誤,如果沒有錯誤的話make指令碼會在螢幕的最後一行輸出Done。至此Kaldi的編譯安裝完成了,可以愉快的開始訓練模型了。
執行yesno例項
步驟和結果如下:
1.直接執行./run.sh。因為run.sh裡面可以直接下載。
測試呈現在linux上的結果:
book@book-desktop:~/kaldi/egs/yesno/s5$ sudo ./run.sh
[sudo] password for book:
–2017-07-03 15:20:32– http://www.openslr.org/resources/1/waves_yesno.tar.gz
Resolving www.openslr.org (www.openslr.org)… 35.184.122.207
Connecting to www.openslr.org (www.openslr.org)|35.184.122.207|:80… connected.
HTTP request sent, awaiting response… 200 OK
Length: 4703754 (4.5M) [application/x-gzip]
Saving to: 鈥榳aves_yesno.tar.gz鈥
waves_yesno.tar.gz 100%[===================>] 4.49M 148KB/s in 45s
Data preparation succeeded
Dictionary preparation succeeded
Preparing train and test data
Preparing word lists etc.
fstaddselfloops ‘echo 4 |’ ‘echo 4 |’
Preparing language models for test
arpa2fst -
\data\
Processing 1-grams
Connected 0 states without outgoing arcs.
fstisstochastic data/lang_test_tg/G.fst
1.20397 0
Succeeded in formatting data.
Succeeded creating MFCC features for train_yesno
Succeeded creating MFCC features for test_yesno
Computing cepstral mean and variance statistics
Initializing monophone system.
Compiling training graphs
Aligning data equally (pass 0)
Pass 1
Aligning data
Pass 2
Aligning data
Pass 3
Aligning data
Pass 4
Aligning data
Pass 5
Aligning data
Pass 6
Aligning data
Pass 7
Aligning data
Pass 8
Aligning data
Pass 9
Aligning data
Pass 10
Aligning data
Pass 11
Pass 12
Aligning data
Pass 13
Pass 14
Aligning data
Pass 15
Pass 16
Aligning data
Pass 17
Pass 18
Aligning data
Pass 19
Pass 20
Aligning data
Pass 21
Pass 22
Pass 23
Aligning data
Pass 24
Pass 25
Pass 26
Aligning data
Pass 27
Pass 28
Pass 29
Aligning data
Pass 30
Pass 31
Pass 32
Aligning data
Pass 33
Pass 34
Pass 35
Aligning data
Pass 36
Pass 37
Pass 38
Aligning data
Pass 39
1 warnings in exp/mono0a/log/update.3.log
1 warnings in exp/mono0a/log/update.7.log
Done
fstminimizeencoded
fstdeterminizestar –use-log=true
fsttablecompose data/lang_test_tg/L_disambig.fst data/lang_test_tg/G.fst
fstisstochastic data/lang_test_tg/tmp/LG.fst
1.20412 -2.34608e-05
warning: LG not stochastic.
fstcomposecontext –context-size=1 –central-position=0 –read-disambig-syms=data/lang_test_tg/tmp/disambig_phones.list –write-disambig-syms=data/lang_test_tg/tmp/disambig_ilabels_1_0.list data/lang_test_tg/tmp/ilabels_1_0
fstisstochastic data/lang_test_tg/tmp/CLG_1_0.fst
1.20412 -2.34608e-05
warning: CLG not stochastic.
make-h-transducer –disambig-syms-out=exp/mono0a/graph_tgpr/disambig_tid.list –transition-scale=1.0 data/lang_test_tg/tmp/ilabels_1_0 exp/mono0a/tree exp/mono0a/final.mdl
fstminimizeencoded
fsttablecompose exp/mono0a/graph_tgpr/Ha.fst data/lang_test_tg/tmp/CLG_1_0.fst
fstdeterminizestar –use-log=true
fstrmsymbols exp/mono0a/graph_tgpr/disambig_tid.list
fstrmepslocal
fstisstochastic exp/mono0a/graph_tgpr/HCLGa.fst
1.20412 -2.34608e-05
HCLGa is not stochastic
add-self-loops –self-loop-scale=0.1 –reorder=true exp/mono0a/final.mdl
…
%WER 0.00 [ 0 / 232, 0 ins, 0 del, 0 sub ] xp/mono0a/decode_test_yesno/wer_10
實驗前可以看一下說明檔案。
---------------------
作者:Shmily_Young
來源:CSDN
原文:https://blog.csdn.net/shmilyforyq/article/details/74203894
版權宣告:本文為博主原創文章,轉載請附上博文連結!
這裡其實很簡單隻用了少部分的庫,這個配置的環境還不能跑timit實驗,下一步將要講如何配置timit的環境。
相關文章
- kaldi環境搭建 | yesno 測試
- kaldi 的安裝及測試
- kaldi安裝(Ubuntu)Ubuntu
- Kaldi學習(一)kaldi在ubuntu上的安裝Ubuntu
- kaldi+cuda安裝
- Kaldi學習手記(一):Kaldi的編譯安裝編譯
- kaldi上使用gpu以及如何安裝cudaGPU
- kaldi+pdnn 的簡介與安裝DNN
- Kaldi的decode測試資料結果
- UBUNTU安裝kaldi遇到關於not install OpenFst errorUbuntuNFSError
- kaldi的編譯安裝與報錯解決方法編譯
- Kaldi學習(二)
- Kaldi配置環境變數變數
- KALDI語音識別庫在LINUX下的安裝和編譯Linux編譯
- 語音識別開源工具PyTorch-Kaldi:兼顧Kaldi效率與PyTorch靈活性開源工具PyTorch
- Kaldi關於Openfst版本的選擇NFS
- kaldi DNN線上解碼 aishell為例DNNAI
- kaldi或者eesen atlas編譯失敗編譯
- Kaldi 離線線上解碼應用
- KALDI-IO庫的生成與讀取
- Kaldi在ubuntu 18.04下編譯小結Ubuntu編譯
- OfficialKaldi(一)| 關於Kaldi專案(翻譯註解)
- 語音識別--kaldi環境搭建(基於Ubuntu系統)Ubuntu
- 安裝測試kafkaKafka
- memcached安裝測試
- mq安裝測試MQ
- sqlserver 安裝測試SQLServer
- OGG安裝測試
- 測試安裝是否成功
- redis第一步(安裝)Redis
- Kaldi執行過程中遇到的一些問題(持續更新...)
- app的安裝與解除安裝測試點APP
- 安裝第一步無法繼續!!!(檢測出錯)
- 【MySQL】Tokudb安裝測試初探MySql
- vue測試安裝和配置Vue
- MHA安裝搭建和測試
- Django 測試是否安裝成功Django
- 效能測試 -- docker安裝influxdbDockerUX