当前位置:   article > 正文

实力超ChatGPT-4!阿里Qwen1.5上线!_qwen1.5 72b 性能

qwen1.5 72b 性能

实力超ChatGPT-4!阿里Qwen1.5上线!
腾朗AI对话 腾朗AI对话 2024-04-07 19:16 湖南
阿里大模型,再次开源!
发布Qwen1.5版本,直接放出六种尺寸。
最大的 Qwen1.5-72B-Chat,超过了Claude-2.1, GPT3.5-Turbo-0613。
在某些方面,它的分数甚至比之前的GPT-4还要高。
图片

来自世界各地的开发商纷纷前来道贺,尤其是0.5 B的迷你版,更是让很多人跃跃欲试。
图片

Qwen-VL-Max这个多模态大模型,是不是可以开源?
在这里插入图片描述

另外,它还与 Hugging接口进行了整合,并与十几个主流框架进行了协作,从调试到部署,再到局部推理,一气呵成。
Qwen1.5开源
这一次开放源码的发布,主要集中在四个方面。
首先,有很多模型,我们将开放六个尺寸(0.5 B,1.8 B,4 B,7 B,14 B,72 B)的基本模型,聊天模型,和定量模型(Int4,Int8 GPTQ, AWQ, GGUF)。
图片

其次,更多的生态融入。
现在, Qwen1.5的代码被整合进了 Hugging面部转换器中,使得它在没有trust_remote_code的情况下,transformers>=4.37.0。
在此基础上,项目还将与 vLLM, SGLang部署,Auto AWQ,Auto GPTQ, 用于微调的Axolotl、LLaMA-Factory以及用于本地 LLM 推理的llama.cpp等进行了合作。
Qwen1.5系列可以应用于 Ollama, LMStudio和其他的平台。另外,除了 DashScope,还有Together.ai的 API服务,全世界都可以使用 API服务。
图片

此外,它的性能也更加强大。
就拿基础能力来说, Qwen1.5-72 B在某些评分上,已经超越了GPT-4。
对于较长的上下文支持,整个序列模式的功能都得到了一些扩展。特别是 Chat模式,比如 Qwen1.5-7B-Chat,5项任务中的4项都能达到 GPT-3.5的水平。
Qwen1.5-72B-Chat比 GPT3.5-16 K要好得多,比GPT4-32K稍差一些。
图片

在程序运行上,虽然72 B的聊天模式在数学和视觉效果上都比GPT-4差了一些,但是程序的运行速度却比GPT-4要快得多。
在这里插入图片描述

不过他们表示,未来的版本中得到增强。

而这一次,所有的功能都被更新了。
所有系列都统一支持最大长度为32 k;
多语种综合提高,多语种评价更加丰富;
全系列统一支持system prompt;
统一具备强链接外部系统能力(agent/RAG/Tool-use/Code-interpreter)在这里插入图片描述
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/喵喵爱编程/article/detail/820652
推荐阅读
相关标签
  

闽ICP备14008679号