当前位置:   article > 正文

AI多模态识别ALM大模型分享:Qwen-Audio_大模型语音交互 asr qwen

大模型语音交互 asr qwen

ALM (Large Audio Language Model)

1)Qwen-Audio 声音音频对话
参考:
https://qwen-audio.github.io/Qwen-Audio/
https://huggingface.co/Qwen/Qwen-Audio-Chat
在这里插入图片描述

“Qwen-Audio 接受多种音频(人类语音、自然声音、音乐和歌曲)以及文本作为输入,并输出文本

在线体验地址:
https://modelscope.cn/studios/qwen/Qwen-Audio-Chat-Demo/summary
在这里插入图片描述

Qwen2-Audio:
https://huggingface.co/spaces/Qwen/Qwen2-Audio-Instruct-Demo
在这里插入图片描述

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号