赞
踩
能够接受各种音频信号输入,并根据语音指令执行音频分析或直接响应文本。提供两种交互方式:
语音聊天 voice chat:用户可以自由地与 Qwen2-Audio 进行语音互动,而无需文本输入; 音频分析 audio analysis:用户可以在互动过程中提供音频和文本指令对音频进行分析;
不过目前这两个模型还没有开源,可以期待一下!