赞
踩
为解决上述方法的缺陷,SpeechGPT构建跨模态指令数据集SpeechInstruct和模态链路指令数据集,并且设计三阶段训练任务。
纵观目前主要的大模型落的设计过程,无非为两个过程:预训练和指令集精调
如果基座模型和垂域模型任务相差巨大的话,还需要设计更多阶段的训练任务来减少二者的gap,SpeechGPT也是遵从了大模型落地的流程,设计了三阶段训练任务帮助模型更好理解文本语音的语义特征,处理跨模态任务
因此可以这样理解:预训练帮助模型学习单词,指令集精调帮助模型更好遣词造句
对于TTS任务,指令可以是
对于ASR任务,指令可以是
模型最终能够处理以下图示四种任务:TTS,ASR,语音对话,文本对话
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。