当前位置:   article > 正文

为什么Qwen2用户表示有乱码输出问题?Qwen2系列开源,目前国内非常好用的LLM!

qwen2

Qwen2系列开源,目前国内非常好用的LLM!

原创 阿瞳 原子社 2024年06月07日 13:13 上海

Qwen2系列模型重大升级简介

经过数月的等待和阿里团队不懈的努力,Qwen系列开源模型迎来了从Qwen1.5到Qwen2的飞跃式升级。本次升级亮点包括:

  • 5种不同尺寸的预训练及指令微调模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B;

  • 在中文和英语的基础上,新增27种语言的高质量训练数据;

  • 在多个评测基准上取得领先表现;

  • 显著提升代码和数学能力;

  • 支持更长的上下文长度,最高可达128K tokens(Qwen2-72B-Instruct)。

已经在Hugging Face和ModelScope上同步开源,并在Ollama可以下载使用。

模型基础信息

Qwen2系列包含5种尺寸的模型,具体如下表所示:

模型 参数量 (B) 非Embedding参数量 (B) GQA Tie Embedding
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/851068
推荐阅读
相关标签
  

闽ICP备14008679号