赞
踩
1.words.txt: word->id; phones.txt: 音素->id; silence.csl: 静音音素id; disambig.int: 消歧音素id
2.G.fst生成:先用SRILM等工具对语料进行平滑等操作生成语言模型,再用arpa2fst将arpa语音模型文件转成fst状态机文件。
ngram-count -kndiscount -interpolate -text top_sentence_txt.txt -lm tpo_sentence.lm
cat tpo_sentence.lm | arpa2fst --disambig-symbol=#0 --read-symbol-table=data/lang_nosp_test_tglarge/words.txt - data/lang_nosp_test_tglarge/G.fst
3.fsttablecompose将两个fst(L.fst、G.fst)合并成一个fst(LG.fst),将前端输出字符对应上后端输入即可,合并后前端输入作为合并后fst之输入,后端输出作为合并后输出;fstdeterminizestar做确定化(从一个状态接收同一个输入后只会跳转到一个状态),消除空转移,降低图的冗余度;fstminimizeencoded将fst最小化,将权重尽量前推,尽量利用上语言模型的信息,避免重要路径被剪枝;fstisstochastic进行归一化,保证状态上各输出概率之合为1。
4.fstcomposecontexts根据音素上下文生成CLG.fst。
5.make-h-transducer基于HMM拓扑结构构建不带自转移的声学模型Ha.fst。
6.fsttablecompose合并CLG.fst与Ha.fst生成HCLG.fst。
-----------------------------format_lm.sh-----------------------------
#解压lm语言模型文件,使用arapa2fst(#0为销歧义符,words.txt为字典)生成G.fst
gunzip -c $lm | arpa2fst --disambig-symbol=#0 --read-symbol-table=$out_dir/words.txt - $out_dir/G.fst
-----------------------------mkgraph.sh-----------------------------
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。