中文语音预训练模型：Wav2vec 2.0、HuBERT

作者：Guff_9hys | 2024-08-08 21:02:37

踩

腾讯游戏知几AI团队与西工大ASLP组联合发布了基于 WenetSpeech 1 万小时数据训练的中文版 Wav2vec 2.0 和 HuBERT 模型。

Wav2vec 2.0 [1]，HuBERT [2] 和 WavLM [3] 等语音预训练模型，通过在多达上万小时的无标注语音数据（如 Libri-light ）上的自监督学习，显著提升了自动语音识别（Automatic Speech Recognition, ASR），语音合成（Text-to-speech, TTS）和语音转换（Voice Conversation，VC）等语音下游任务的性能。然而这些模型都没有公开的中文版本，不便于应用在中文语音研究场景。

参考资料：
找不到中文语音预训练模型？中文版Wav2vec 2.0和HuBERT来了

声明：本文内容由网友自发贡献，转载请注明出处：【wpsshop】