赞
踩
2023.11.30 我们在 ModelScope 和 Hugging Face 上发布了Qwen-72B和Qwen-72B-Chat,它们在 3T 令牌上进行训练并支持 32k 上下文,以及Qwen-1.8B和Qwen-1.8B-Chat 。
我们还增强了 Qwen-72B-Chat 和 Qwen-1.8B-Chat 的系统提示功能,请参阅示例文档。
另外,支持Ascend 910和Hygon DCU上的推理。检查ascend-support并dcu-support了解更多详细信息。
网友讨论:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。