Kaldi在語音資料庫timit上的聲學和語音模型訓練--1

std1984發表於2014-09-09
環境: Ubuntu 12.04,  Kaldi


1. 在網上下載timit語音庫,解壓放到/u01/kaldi/egs/timit/s5/data目錄下

jerry@hq:/u01/kaldi/egs/timit/s5/data/timit$ ls
doc  readme.doc  test  TIMIT_phonemes.Table  train

2. 切換到timit主目錄下 /u01/kaldi/egs/timit/s5,
修改run.sh中的一項為 timit=/u01/kaldi/egs/timit/s5/data/timit ,即指定訓練資料的目錄。如下所示:
echo ============================================================================
echo "                Data & Lexicon & Language Preparation                     "
echo ============================================================================


#timit=/export/corpora5/LDC/LDC93S1/timit/TIMIT # @JHU
timit=/u01/kaldi/egs/timit/s5/data/timit # @BUT


local/timit_data_prep.sh $timit || exit 1


3. 直接執行./run.sh就可以了

***********************************************************************************************************************************************************

下面講解下run.sh指令碼的一些處理流程:

local/timit_data_prep.sh    -----  從訓練資料庫/u01/kaldi/egs/timit/s5/data/timit中抽取出訓練資料的目錄位置並寫到/u01/kaldi/egs/timit/s5/data/local/data, 這裡使用的命令/u01/kaldi/src/featbin/wav-to-duration

local/timit_prepare_dict.sh -----   生成字典資料並放至到/u01/kaldi/egs/timit/s5/data/local/dict,使用的命令/u01/kaldi/tools/irstlm/bin/compile-lm, /u01/kaldi/tools/irstlm/bin/build-lm.sh, 

utils/prepare_lang.sh  ----- 藉助字典資料生成語言模型並放至 /u01/kaldi/egs/timit/s5/data/lang,使用的命令utils/make_lexicon_fst.pl, utils/sym2int.pl, fstcompile, fstaddselfloops, fstarcsort, 

steps/make_mfcc.sh,  steps/compute_cmvn_stats.sh  ---- 藉助local/timit_data_prep.sh生成的資料位置抽取出MFCC特徵,資料放到到 /u01/kaldi/egs/timit/s5/data/train,使用的命令compute-mfcc-feats, compute-cmvn-stats, copy-feats,  copy-matrix


單音素訓練與解碼
steps/train_mono.sh ---- 藉助前兩步生成的mfcc和語言模型生成單音素,使用命令gmm-init-mono, compile-train-graphs , align-equal-compiled, gmm-acc-stats-ali, gmm-est, gmm-align-compiled 

utils/mkgraph.s ----  生成decoding graph, 使用的命令fsttablecompose, fstminimizeencoded, fstisstochastic, fstcomposecontext, make-h-transducer, fstdeterminizestar, fstrmsymbols, fstrmepslocal, add-self-loops

steps/decode.sh ----  解碼資料,使用命令gmm-latgen-faster, gmm-decode-faster, compute-wer








來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/16582684/viewspace-1266649/,如需轉載,請註明出處,否則將追究法律責任。

相關文章