AI新工具小模型也有大智慧Qwen1.5-MoE；大模型动态排行榜；马斯克更新Grok-1.5_qwen小模型

作者：从前慢现在也慢 | 2024-04-11 17:46:04

踩

qwen小模型

✨ 1: Qwen1.5-MoE

阿里巴巴一款小型 MoE 模型，只有 27 亿个激活参数，但性能与最先进的 7B 模型（如 Mistral 7B 和 Qwen1.5-7B）相匹配。

在这里插入图片描述

Qwen1.5-MoE是一个使用混合专家模型（Mixture-of-Experts，MoE）架构的尖端人工智能模型。本文简要地用通俗语言解释了Qwen1.5-MoE的功能及其应用场景。

博客： https://qwenlm.github.io/blog/qwen-moe/
HF: https://huggingface.co/Qwen
GitHub：https://github.com/QwenLM/Qwen1.5

地址：https://qwenlm.github.io/blog/qwen-moe/

✨ 2: lmsys

LMSYS Org（由UC伯克利主导）的研究团队正在举行一场前所未有的大语言模型排位赛。

在这里插入图片描述

LMSYS Org 是一个开放的研究组织,由加州大学伯克利分校、圣地亚哥分校和卡内基梅隆大学的学生与教师共同创立。该组织致力于通过开发开放数据集、模型、系统和评估工具,让每个人都能访问大型模型。他们的工作涵盖机器学习和系统方面的研究,包括训练大型语言模型并使其广泛可用,同时开发分布式系统来加速模型训练和推理过程。

过去一年，大语言模型在竞技场的排名浮沉:
GPT4 霸榜一整年！刚被opus超过
2023年5月众多小厂开源选手百花齐放。但后续无力为继纷纷下榜
2023年8月 llama2登场
2023年9月 Claude2登场
2023年12月 GPT1106登场
2024年1月，Mistral登场
2024年3月，Claude3登场

地址：https://lmsys.org/

✨ 3: Grok-1.5

具备更强的推理能力和128,000词元的上下文长度，即将在

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/406458

AI新工具 小模型也有大智慧Qwen1.5-MoE；大模型动态排行榜；马斯克更新Grok-1.5_qwen小模型

✨ 1: Qwen1.5-MoE

✨ 2: lmsys

✨ 3: Grok-1.5

AI新工具小模型也有大智慧Qwen1.5-MoE；大模型动态排行榜；马斯克更新Grok-1.5_qwen小模型