lang
language,语言
示例:data/lang
Language directory
bg
binary-grammar,二阶语言模型
示例:data/lang_test_bg_5k
Language directory used for test, with big dictionary of 5000 words
用于解码测试的语言目录,其字典为包含5000个单词的大字典
tg
triple-grammar,三阶语言模型
示例:data/lang_test_bd_tg
Language directory used for test, big dictionary, triple-grammar
用于解码测试的语言目录,大字典,三阶语言模型
fg
four-grammar,四阶语言模型
示例:data/lang_test_bd_fg
Language directory used for test, big dictionary, four-grammar
用于解码测试的语言目录,大字典,四阶语言模型
bd
big dict,大字典
示例:data/lang_test_bd_tgpr
Language directory used for test, big dictionary, pruned triple-grammar
用于解码测试的语言目录,大字典,裁剪过的三阶语言模型
pr
pruned,裁剪过的
示例:data/lang_test_tgpr_5k
Language directory used for test, with dictionary of 5000 words, pruned triple-grammar
用于解码测试的语言目录,其字典为包含5000个单词的大字典,裁剪过的三阶语言模型
DAE
Denoising Auto Encoder
降噪自动编码器,常作为DNN的前端,用于降噪
示例:thchs30/local/dae
hires
high resolution
高分辨率,高维数,通常表示40维的MFCC特征
示例:data/train_hires
sp
speed perturb,速度扰动,通常表示通过速度扰动进行增广过的数据集
silence phone,静音音素
nosp
no silence phone,无静音音素,通常用于音素集中没有静音音素的语言目录
示例:data/lang_nosp
nodup
no duplex,无重复的,文本无重复,通常表示已经将训练集相同标注的语句去除
示例:data/train_nodup
2y、7d
数字+字母形式的调优版本,字母可省略。通常出现在kaldi/egs/*/local/{nnet3,chain}/tuning目录以及相关目录中。
a, b,..., z
1a, 1b,..., 1z
...
示例:
-
swbd/s5c/local/chain/tuning/run_tdnn_blstm_a.sh
TDNN-BLSTM的基线模型
-
swbd/s5c/local/chain/tuning/run_tdnn_blstm_2y.sh
TDNN-BLSTM的调优模型,版本为2y
-
swbd/s5c/local/chain/tuning/run_tdnn_blstm_7d.sh
TDNN-BLSTM的调优模型,版本为7d
-
exp/chain/tri6_7d_tree
版本为7d的调优模型所使用的决策树目录
-
data/lang_chain_2y
版本为2y的Chain调优模型所使用的语言目录
sw1
Switchboard 1
因为Switchboard由多个部分组成,而kaldi/egs/swbd示例只使用了Switchboard-1 Phase 1,因此相关数据集、转录等缩写为sw1。
示例:
-
data/lang_nosp_sw1_tg
语言目录,不包含静音音素,其中三阶语言模型使用Switchboard 1转录训练
-
exp/tri1/graph_nosp_sw1_tg
解码图目录,不包含静音音素,其中三阶语言模型使用Switchboard 1转录训练
fsh
fisher,egs/fisher_english示例及其相关数据
示例:data/lang_fsh_sw1_tg
语言目录,其中三阶语言模型使用fisher_english和Switchboard 1的转录进行训练得到
xent
Cross Entropy,交叉熵,通常表示Chain模型的交叉熵正则化
示例:xent_regularize=0.1,交叉熵正则化系数
egs
examples,示例,通常表示Kaldi脚本示例
例如:kaldi/egs目录
examples,样本,通常表示训练样本
例如:exp/chain/tdnn_blstm_a/egs目录
eg
example,样本,通常表示训练样本
示例:
-
--frames-overlap-per-eg 0
训练样本之间重叠(重复)的帧数为0
-
--frames-per-eg 50
一个训练样本包含50帧
si
speeker independent,说话人无关,即没有进行说话人自适应训练(SAT)
示例:steps/align_si.sh
说话人无关的对齐