当前位置:   article > 正文

Kaldi中文语音识别-----手把手教你kaldi的安装编译

kaldi中文语音识别

写在前面:
本人目前读研中,小白一枚,主要研究方向:语音识别及语音歌曲合成,在这里记录一下自己学习软件的过程,还望大神们口下留情。

kaldi是什么

kaldi是一个用C++写的语音识别工具包。kaldi旨在供语音识别研究员使用。当然,kaldi也可以用作声纹识别。关于他的详细介绍可以访问kaldi的官方文档。

Kaldi是一个非常强大的语音识别工具库,主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义,DNN、CNN、TDNN、LSTM以及Bidirectional-LSTM等神经网络结构均可支持。

kaldi与中文语音识别

清华大学开源的thchs30数据集(疯狂为CSLT打电话~~~)
CVTE公司开源的CVTE Mandarin Model模型
Beijing Shell Shell Technology公司开源的aishell数据集

编译与安装kaldi

注意:为了提高训练的速度,kaldi最好安装在GPU云服务器下。如果没有服务器话,使用虚拟机应该也是可以的,但一定要分配足够的内存空间和存储空间。下面我就以我使用的centos服务器为例,介绍kaldi的编译与安装。

编译与安装大概分为3步

安装git、下载kaldi的源码
安装编译所需依赖包
配置、编译kaldi

  • 下载以及安装

与其他开源软件一样,首先Clo

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/448173
推荐阅读
相关标签
  

闽ICP备14008679号