赞
踩
写在前面:
本人目前读研中,小白一枚,主要研究方向:语音识别及语音歌曲合成,在这里记录一下自己学习软件的过程,还望大神们口下留情。
kaldi是一个用C++写的语音识别工具包。kaldi旨在供语音识别研究员使用。当然,kaldi也可以用作声纹识别。关于他的详细介绍可以访问kaldi的官方文档。
Kaldi是一个非常强大的语音识别工具库,主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义,DNN、CNN、TDNN、LSTM以及Bidirectional-LSTM等神经网络结构均可支持。
kaldi与中文语音识别
清华大学开源的thchs30数据集(疯狂为CSLT打电话~~~)
CVTE公司开源的CVTE Mandarin Model模型
Beijing Shell Shell Technology公司开源的aishell数据集
注意:为了提高训练的速度,kaldi最好安装在GPU云服务器下。如果没有服务器话,使用虚拟机应该也是可以的,但一定要分配足够的内存空间和存储空间。下面我就以我使用的centos服务器为例,介绍kaldi的编译与安装。
编译与安装大概分为3步
安装git、下载kaldi的源码
安装编译所需依赖包
配置、编译kaldi
与其他开源软件一样,首先Clo
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。