当前位置:   article > 正文

大模型的实践应用7-阿里的多版本通义千问Qwen大模型的快速应用与部署_通义千问 token上限

通义千问 token上限

大家好,我是微学AI,今天给大家介绍一下大模型的实践应用7-阿里的多版本通义千问Qwen大模型的快速应用与部署。阿里云开源了Qwen系列模型,即Qwen-7B和Qwen-14B,以及Qwen的聊天模型,即Qwen-7B-Chat和Qwen-14B-Chat。通义千问模型针对多达 3 万亿个 token 的多语言数据进行了稳定的预训练,覆盖领域、语言等,能够实现有竞争力的基准数据集上的性能。此外,阿里还基于SFT和RLHF(尚未发布)的符合人类偏好的聊天模型,能够聊天、创建内容、提取信息、解决数学问题等,并且能够使用工具,扮演代理,甚至扮演代码解释器等。
在这里插入图片描述

一、阿里大模型(通义千问)更新列表:

2023.8.3 我在 ModelScope 和 Hugging Face 上发布了Qwen-7B和Qwen-7B-Chat 。阿里还提供了有关模型的更多详细信息的技术备忘录,包括训练细节和模型性能。

2023.8.21 阿里发布了 Qwen-7B-Chat 的 Int4 量化模型Qwen-7B-Chat-Int4,该模型需要较低的内存成本,但可以提高推理速度。此外,基准评估没有明显的性能下降。
2023.9.12 支持Qwen-7B模型的微调,包括全参数微调、LoRA和Q-LoRA。

2023.9.25 阿里在 ModelScope 和 Hugging Face 上发布了Qwen-14B和Qwen-14B-Chat,以及qwen.cpp和Qwen-Agent。Qwen-7B和Qwen-7B-Chat的代码和检查点也已更新。请拉取最新版本!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/454126
推荐阅读
相关标签
  

闽ICP备14008679号