kaldi第一步安裝kaldi測試yesno
Kaldi是一個非常強大的語音識別工具庫,主要由Daniel Povey開發和維護。目前支援GMM-HMM、SGMM-HMM、DNN-HMM等多種語音識別的模型的訓練和預測。其中DNN-HMM中的神經網路還可以由配置檔案自定義,DNN、CNN、TDNN、LSTM以及Bidirectional-LSTM等神經網路結構均可支援。
目前在Github上這個專案依舊非常活躍,可以在 https://github.com/kaldi-asr/kaldi 下載程式碼,以及在 http://kaldi-asr.org/ 檢視它的文件。
下載以及安裝
與其他開源軟體一樣,首先Clone它在Github上的程式碼
$ git clone https://github.com/kaldi-asr/kaldi
1
Clone下來之後按照INSTALL檔案的指示,需要先完成tools資料夾下的編譯安裝,然後再去編譯src下的內容。因此,先去tools資料夾:
$ cd kaldi/tools
在tools資料夾下依舊有一個INSTALL,我們根據它的指示,一步一步完成安裝。首先,需要執行extras/check_dependencies.sh這個指令碼來檢查一些依賴的環境是否存在並且正確配置。
$ extras/check_dependencies.sh
extras/check_dependencies.sh: automake is not installed.
extras/check_dependencies.sh: autoconf is not installed.
extras/check_dependencies.sh: neither libtoolize nor glibtoolize is installed
extras/check_dependencies.sh: subversion is not installed
extras/check_dependencies.sh: we recommend that you run (our best guess):
sudo apt-get install automake autoconf libtool subversion
You should probably do:
sudo apt-get install libatlas3-base
/bin/sh is linked to dash, and currently some of the scripts will not run properly. We recommend to run:
sudo ln -s -f bash /bin/sh
1
2
3
4
5
6
7
8
9
10
11
這個輸出的結果不同的Linux會不相同(我的是Ubuntu 16.04)。根據check_dependencies.sh輸出結果的提示,安裝缺的包,以及配置正確的環境
$ sudo apt-get install automake autoconf libtool subversion
$ sudo apt-get install libatlas3-base
$ sudo ln -s -f bash /bin/sh
1
2
3
然後再重新執行一遍check_dependencies.sh
$ extras/check_dependencies.sh
extras/check_dependencies.sh: all OK.
1
2
如果輸出以上結果,那麼我們可以繼續安裝了
$ make -j 16
1
其中-j 16是開16個job同時進行編譯,這個可以根據CPU核心的數量進行指定。確定沒有錯誤後切換到src資料夾
$ cd ../src
1
這裡面也包含了一個INSTALL檔案,按照裡面的步驟編譯和安裝
$ ./configure
1
執行完成後在最後一行可以看到SUCCESS,如果沒有的話那應該是哪個步驟出問題了,可以去檢查一下上面幾個步驟是否有錯誤
$ make depend
$ make -j 16
1
2
檢查一下編譯是否有錯誤,如果沒有錯誤的話make指令碼會在螢幕的最後一行輸出Done。至此Kaldi的編譯安裝完成了,可以愉快的開始訓練模型了。
執行yesno例項
步驟和結果如下:
1.直接執行./run.sh。因為run.sh裡面可以直接下載。
測試呈現在linux上的結果:
book@book-desktop:~/kaldi/egs/yesno/s5$ sudo ./run.sh
[sudo] password for book:
–2017-07-03 15:20:32– http://www.openslr.org/resources/1/waves_yesno.tar.gz
Resolving www.openslr.org (www.openslr.org)… 35.184.122.207
Connecting to www.openslr.org (www.openslr.org)|35.184.122.207|:80… connected.
HTTP request sent, awaiting response… 200 OK
Length: 4703754 (4.5M) [application/x-gzip]
Saving to: 鈥榳aves_yesno.tar.gz鈥
waves_yesno.tar.gz 100%[===================>] 4.49M 148KB/s in 45s
Data preparation succeeded
Dictionary preparation succeeded
Preparing train and test data
Preparing word lists etc.
fstaddselfloops ‘echo 4 |’ ‘echo 4 |’
Preparing language models for test
arpa2fst -
\data\
Processing 1-grams
Connected 0 states without outgoing arcs.
fstisstochastic data/lang_test_tg/G.fst
1.20397 0
Succeeded in formatting data.
Succeeded creating MFCC features for train_yesno
Succeeded creating MFCC features for test_yesno
Computing cepstral mean and variance statistics
Initializing monophone system.
Compiling training graphs
Aligning data equally (pass 0)
Pass 1
Aligning data
Pass 2
Aligning data
Pass 3
Aligning data
Pass 4
Aligning data
Pass 5
Aligning data
Pass 6
Aligning data
Pass 7
Aligning data
Pass 8
Aligning data
Pass 9
Aligning data
Pass 10
Aligning data
Pass 11
Pass 12
Aligning data
Pass 13
Pass 14
Aligning data
Pass 15
Pass 16
Aligning data
Pass 17
Pass 18
Aligning data
Pass 19
Pass 20
Aligning data
Pass 21
Pass 22
Pass 23
Aligning data
Pass 24
Pass 25
Pass 26
Aligning data
Pass 27
Pass 28
Pass 29
Aligning data
Pass 30
Pass 31
Pass 32
Aligning data
Pass 33
Pass 34
Pass 35
Aligning data
Pass 36
Pass 37
Pass 38
Aligning data
Pass 39
1 warnings in exp/mono0a/log/update.3.log
1 warnings in exp/mono0a/log/update.7.log
Done
fstminimizeencoded
fstdeterminizestar –use-log=true
fsttablecompose data/lang_test_tg/L_disambig.fst data/lang_test_tg/G.fst
fstisstochastic data/lang_test_tg/tmp/LG.fst
1.20412 -2.34608e-05
warning: LG not stochastic.
fstcomposecontext –context-size=1 –central-position=0 –read-disambig-syms=data/lang_test_tg/tmp/disambig_phones.list –write-disambig-syms=data/lang_test_tg/tmp/disambig_ilabels_1_0.list data/lang_test_tg/tmp/ilabels_1_0
fstisstochastic data/lang_test_tg/tmp/CLG_1_0.fst
1.20412 -2.34608e-05
warning: CLG not stochastic.
make-h-transducer –disambig-syms-out=exp/mono0a/graph_tgpr/disambig_tid.list –transition-scale=1.0 data/lang_test_tg/tmp/ilabels_1_0 exp/mono0a/tree exp/mono0a/final.mdl
fstminimizeencoded
fsttablecompose exp/mono0a/graph_tgpr/Ha.fst data/lang_test_tg/tmp/CLG_1_0.fst
fstdeterminizestar –use-log=true
fstrmsymbols exp/mono0a/graph_tgpr/disambig_tid.list
fstrmepslocal
fstisstochastic exp/mono0a/graph_tgpr/HCLGa.fst
1.20412 -2.34608e-05
HCLGa is not stochastic
add-self-loops –self-loop-scale=0.1 –reorder=true exp/mono0a/final.mdl
…
%WER 0.00 [ 0 / 232, 0 ins, 0 del, 0 sub ] xp/mono0a/decode_test_yesno/wer_10
實驗前可以看一下說明檔案。
---------------------
作者:Shmily_Young
來源:CSDN
原文:https://blog.csdn.net/shmilyforyq/article/details/74203894
版權宣告:本文為博主原創文章,轉載請附上博文連結!
這裡其實很簡單隻用了少部分的庫,這個配置的環境還不能跑timit實驗,下一步將要講如何配置timit的環境。
相關文章
- kaldi環境搭建 | yesno 測試
- Kaldi學習(一)kaldi在ubuntu上的安裝Ubuntu
- kaldi+cuda安裝
- UBUNTU安裝kaldi遇到關於not install OpenFst errorUbuntuNFSError
- kaldi的編譯安裝與報錯解決方法編譯
- Kaldi學習(二)
- Kaldi中啟用cuda
- 語音識別開源工具PyTorch-Kaldi:兼顧Kaldi效率與PyTorch靈活性開源工具PyTorch
- kaldi DNN線上解碼 aishell為例DNNAI
- Kaldi關於Openfst版本的選擇NFS
- Kaldi在ubuntu 18.04下編譯小結Ubuntu編譯
- KALDI-IO庫的生成與讀取
- OfficialKaldi(一)| 關於Kaldi專案(翻譯註解)
- 語音識別--kaldi環境搭建(基於Ubuntu系統)Ubuntu
- 安裝測試kafkaKafka
- sqlserver 安裝測試SQLServer
- 解決 /kaldi-trunk/tools 目錄下make安裝報錯需要支援 ISO C++ 2011 -std=c++11 or -std=gnu++11C++
- 第一步,anaconda的安裝
- app的安裝與解除安裝測試點APP
- Kaldi搭建語音識別系統—發音詞典相關檔案準備
- 效能測試 -- docker安裝influxdbDockerUX
- vue測試安裝和配置Vue
- pyflink的安裝和測試
- 新一代 Kaldi: 支援 JavaScript 進行本地語音識別和語音合成啦!JavaScript
- 【GO】MAC安裝和測試GoGoMac
- SpringBoot Cli 安裝執行測試Spring Boot
- 軟體測試--selenium安裝使用
- 軟體測試--selenium 安裝使用
- 安卓開發第一步:安卓面試題安卓面試題
- 每日測試思維培養—— PC端安裝解除安裝軟體,怎麼測試,如何設計測試用例?
- cloudera 5 的安裝測試步驟Cloud
- CentOS 下效能測試工具 wrk 安裝CentOS
- Jmeter下載安裝配置---測試小白JMeter
- 介面測試:postman的安裝與使用Postman
- 三十七、Flume的安裝及測試
- 6.linux->MySQL 安裝及效能測試LinuxMySql
- MQTT系列實踐一 EMQTT安裝與測試MQQT
- openGauss/MogDB-3.0.0 dcf測試(非om安裝)