语音训练系统ant4 sphinxtrain_sphinxtrain 怎么开始

作者：花生_TL007 | 2024-03-16 13:01:39

踩

sphinxtrain 怎么开始

http://www.blogbus.com/yesho-logs/10287047.html

可以从Sphinx网站上免费下载SphinxTrain和AN4语料库，解压之后编译SphinxTrain，参考SphinxTrain\doc\tinydoc.txt搭建训练系统（windows下）。

1. 建立训练系统工作目录an4，在此目录下运行
perl $SPHINXTRAINDIR\scripts_pl\setup_SphinxTrain.pl -task an4

2. 将AN4语料库中用于训练的语音文件，即wav\an4_clstk\里的数据copy到工作目录an4\wav\下。

3. 将AN4语料库中的其他文件，即etc\目录下的文件copy到an4\etc\下，包括an4.dic、an4.filler、an4.phone、an4_train.fileids、an4_train.transcription，修改an4_train.fileids的内容，去掉所有行中的an4_clstk/。

4. 运行
perl scripts_pl\make_feats.pl -ctl etc\an4_train.fileids
提取特征。

5. scripts_pl目录下有很多文件夹，对应各个不同的训练任务。参考RunAll.pl可以了解应该运行各目录下哪个perl文件。这里我们选用20.ci_hmm\slave_convg.pl，建立一个CI（Context Independent）的连续HMM系统，完成之后在model_parameters\an4.ci_cont\下得到模型参数。

6. 此时得到的模型每个状态的Gauss mixture数为1，如果想要mixture数大于1，修改sphinx_train.cfg中的$CFG_CI_MGAU='yes'，mixture数可以修改$CFG_FINAL_NUM_DENSITIES，默认为8;

7. split_gaussian.pl中存在bug，137行调用inc_comp.exe时给了参数-feat和-ceplen，去掉。

8. 重新运行20.ci_hmm\slave_convg.pl，最终得到的模型参数在\model_parameters\an4.ci_cont_n\下，n为mixture数。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/花生_TL007/article/detail/249628