当前位置: article > 正文

大模型的实践应用7-阿里的多版本通义千问Qwen大模型的快速应用与部署_通义千问 token上限

作者：羊村懒王 | 2024-04-19 23:20:02

踩

通义千问 token上限

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用7-阿里的多版本通义千问Qwen大模型的快速应用与部署。阿里云开源了Qwen系列模型，即Qwen-7B和Qwen-14B，以及Qwen的聊天模型，即Qwen-7B-Chat和Qwen-14B-Chat。通义千问模型针对多达 3 万亿个 token 的多语言数据进行了稳定的预训练，覆盖领域、语言等，能够实现有竞争力的基准数据集上的性能。此外，阿里还基于SFT和RLHF（尚未发布）的符合人类偏好的聊天模型，能够聊天、创建内容、提取信息、解决数学问题等，并且能够使用工具，扮演代理，甚至扮演代码解释器等。
在这里插入图片描述

一、阿里大模型（通义千问）更新列表：

2023.8.3 我在 ModelScope 和 Hugging Face 上发布了Qwen-7B和Qwen-7B-Chat 。阿里还提供了有关模型的更多详细信息的技术备忘录，包括训练细节和模型性能。

2023.8.21 阿里发布了 Qwen-7B-Chat 的 Int4 量化模型Qwen-7B-Chat-Int4，该模型需要较低的内存成本，但可以提高推理速度。此外，基准评估没有明显的性能下降。
2023.9.12 支持Qwen-7B模型的微调，包括全参数微调、LoRA和Q-LoRA。

2023.9.25 阿里在 ModelScope 和 Hugging Face 上发布了Qwen-14B和Qwen-14B-Chat，以及qwen.cpp和Qwen-Agent。Qwen-7B和Qwen-7B-Chat的代码和检查点也已更新。请拉取最新版本！

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】