Kaldi中文语音识别-----手把手教你kaldi的安装编译

作者：从前慢现在也慢 | 2024-04-18 20:54:24

踩

kaldi中文语音识别

写在前面：
本人目前读研中，小白一枚，主要研究方向：语音识别及语音歌曲合成，在这里记录一下自己学习软件的过程，还望大神们口下留情。

kaldi是什么

kaldi是一个用C++写的语音识别工具包。kaldi旨在供语音识别研究员使用。当然，kaldi也可以用作声纹识别。关于他的详细介绍可以访问kaldi的官方文档。

Kaldi是一个非常强大的语音识别工具库，主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义，DNN、CNN、TDNN、LSTM以及Bidirectional-LSTM等神经网络结构均可支持。

kaldi与中文语音识别

清华大学开源的thchs30数据集（疯狂为CSLT打电话~~~）
CVTE公司开源的CVTE Mandarin Model模型
Beijing Shell Shell Technology公司开源的aishell数据集

编译与安装kaldi

注意：为了提高训练的速度，kaldi最好安装在GPU云服务器下。如果没有服务器话，使用虚拟机应该也是可以的，但一定要分配足够的内存空间和存储空间。下面我就以我使用的centos服务器为例，介绍kaldi的编译与安装。

编译与安装大概分为3步

安装git、下载kaldi的源码
安装编译所需依赖包
配置、编译kaldi

下载以及安装

与其他开源软件一样，首先Clo

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/448173