当前位置:   article > 正文

kaldi中文语音识别_基于thchs30(8)_kaldi thuchs30 实测

kaldi thuchs30 实测

接上回,我们继续看run.sh
#copy feats and cmvn to test.ph, avoid duplicated mfcc & cmvn #拷贝mfcc特征和cmvn到test.ph,避免重复的mfcc和cmvn
cp data/mfcc/test/feats.scp data/mfcc/test_phone && cp data/mfcc/test/cmvn.scp data/mfcc/test_phone || exit 1;

如果此时运行,会报错data/mfcc/test/feats.scp 找不到该文件,是因为我们之前在 run.sh中选择只对train进行处理,其实还需要对dev test 也进行处理,所以我们需要将dev test加上,然后重新进行处理,就不会报错了。
我们看一下data/mfcc/test/feats.scp    我们看到这个也是mfcc特征提取一样的,也有ark:标识,但是说话者ID都是D,说明是测试集的

我们看到/opt/kaldi/egs/thchs30/thchs30-openslr/data_thchs30/test下都是D开头的,说明就是测试集

我们看一下data/mfcc/test/cmvn.scp,里面

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/998036
推荐阅读
相关标签
  

闽ICP备14008679号