当前位置:   article > 正文

阿里大模型春节礼包来了:代码可执行率超GPT-4,1.5版本全系列开源

阿里大模型春节礼包来了:代码可执行率超GPT-4,1.5版本全系列开源
白交 发自 凹非寺
量子位 | 公众号 QbitAI

阿里大模型,再次开源大放送——

发布Qwen1.5版本,直接放出六种尺寸。

最大的Qwen1.5-72B-Chat模型,在MT-Bench和Alpaca-Eval v2上,超越Claude-2.1、GPT-3.5-Turbo-0613。

甚至在部分任务中,得分已经超过前几个版本的GPT-4。

c7dc1ab086f103e75f7db0080ba27575.jpeg

各地的开发者前来祝贺,其中0.5B的迷你版让不少人都迫不及待想试试。

8b6184e87e906f9217045dc4dcabd8ff.png
并且还顺便问问,那个多模态大模型Qwen-VL-Max有可能开源吗?

351f9fbdbe5d0913a37db111cc63c960.png

除此之外,还集成到了Hugging face transformers,以及同主流的十余个框架合作,从微调、部署、量化到本地推理一步到位。

Qwen1.5开源

此次开源发布,主要有四个方面值得关注。

首先,模型系列很多,直接开源了6种尺寸(0.5B、1.8B、4B、7B、14B、72B)的基础模型(base)、聊天模型(chat)以及量化模型(包括Int4 和 Int8 GPTQ 模型,以及 AWQ 和 GGUF 量化模型)。

afcc474d174ee93bdc4e42c20a4efe3f.png

其次,更多的生态融入。

目前,Qwen1.5的代码合并到Hugging Face transformers,使其transformers>=4.37.0而无需trust_remote_code。

此外,还同主流的第三方框架,比如vLLM、用于部署的SGLang 、用于量化的AutoAWQ、AutoGPTQ 、用于微调的Axolotl、LLaMA-Factory以及用于本地 LLM 推理的llama.cpp等进行了合作。

Qwen1.5系列可在Ollama、LMStudio等平台上使用。此外,API 服务不仅在 DashScope 上提供,而且在Together.ai上也提供,具有全球可访问性。

2b49fdc5b61368849798128e142771be.png
再者,性能更强。

比如在基本能力的评估上,包括MMLU(5-shot)、C-Eval、Humaneval、GS8K、BBH等基准测试中可以看到,Qwen1.5-72B一些分数上已经超过了GPT-4。

f1f3529309704f164269906ff7eed3cb.png

长上下文支持上,全系列模型的能力都有一定的拓展。尤其Chat模型,像Qwen1.5-7B-Chat这样的小模型,在5个任务中有4个表现与GPT-3.5相当。

而Qwen1.5-72B-Chat的性能,则明显优于 GPT3.5-turbo-16k,略微落后于 GPT4-32k。

746a70212cf83ac4186f6656bf3a2b7b.png

在代码执行上,72B聊天模型在数学以及可视化方面离GPT-4还有一定的差距,但代码可执行率超过GPT-4。不过他们表示,会在在未来的版本中得到增强。

7f8e88dd1910d18151bbe5d7b8e5805d.png

除此之外,此次功能也得到了升级和统一。

  • 全系列均统一支持至少32k的最大长度;

  • 多语言能力全面提升并提供了更丰富的多语言评测;

  • 全系列统一支持system prompt;

  • 统一具备强链接外部系统能力(agent/RAG/Tool-use/Code-interpreter)

One More Thing

这两天,与阿里大模型的进展还不少。

比如前几天,其多模态大模型Qwen-VL-Max登顶OpenCompass榜首。

9377a4d17dad481175cce6ff5f3a8599.jpeg

以及在通义千问APP上,上线了不少春节免费新应用,比如全家福、拜新年、万物成龙等图像生成的功能。

35c9d836829238a4fce445a41f7b8b46.jpeg

此外,还有网友反馈说,通义千问2.0版本升级之后,能力提升得很明显。

94c49ac76d54d8c929c218f23f83062f.png

你有感受到吗?

项目链接:
https://huggingface.co/collections/Qwen/qwen15-65c0a2f577b1ecb76d786524
https://qwenlm.github.io/zh/blog/qwen1.5/

参考链接:
[1]https://twitter.com/JustinLin610/status/1754538215959335100
[2]https://twitter.com/huybery/status/1754537742892232972
[3]https://twitter.com/_akhaliq/status/1754545091434139732

—  —

点这里

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/820648
推荐阅读
相关标签