kaldi中文语音识别_基于thchs30(8)_kaldi thuchs30 实测

作者：笔触狂放9 | 2024-08-18 15:29:15

踩

kaldi thuchs30 实测

接上回，我们继续看run.sh
#copy feats and cmvn to test.ph, avoid duplicated mfcc & cmvn #拷贝mfcc特征和cmvn到test.ph，避免重复的mfcc和cmvn
cp data/mfcc/test/feats.scp data/mfcc/test_phone && cp data/mfcc/test/cmvn.scp data/mfcc/test_phone || exit 1;

如果此时运行，会报错data/mfcc/test/feats.scp 找不到该文件，是因为我们之前在 run.sh中选择只对train进行处理,其实还需要对dev test 也进行处理,所以我们需要将dev test加上，然后重新进行处理,就不会报错了。
我们看一下data/mfcc/test/feats.scp 我们看到这个也是mfcc特征提取一样的,也有ark:标识,但是说话者ID都是D,说明是测试集的

我们看到/opt/kaldi/egs/thchs30/thchs30-openslr/data_thchs30/test下都是D开头的，说明就是测试集

我们看一下data/mfcc/test/cmvn.scp，里面

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/笔触狂放9/article/detail/998036