DeepSeek-V2：强大、经济、高效的混合专家语言模型 github页面

作者：煮酒与君饮 | 2024-07-25 06:08:34

踩

DeepSeek-V2：强大、经济、高效的混合专家语言模型

1. 简介

今天我们来介绍 DeepSeek-V2，这是一个强大的混合专家 (MoE) 语言模型，具有训练经济、推理高效的特点。它总共包含 236B 参数，其中每个 token 激活 21B。与 DeepSeek 的 67B 相比，DeepSeek-V2 实现了更强的性能，同时节省了 42.5% 的训练成本，减少了 93.3% 的 KV 缓存，并将最大生成吞吐量提升至 5.76 倍。

我们在一个包含 8.1 万亿个 token 的多样化高质量语料库上对 DeepSeek-V2 进行了预训练。在进行全面的预训练之后，我们进行了监督微调 (SFT) 和强化学习 (RL)，以充分发挥模型的功能。评估结果验证了我们方法的有效性，因为 DeepSeek-V2 在标准基准和开放式生成评估中都取得了出色的表现。

2. 新闻

2024.05.16：我们发布了DeepSeek-V2-Lite。
2024.05.06：我们发布了DeepSeek-V2。

3. 模型下载

模型	#总参数	#已激活参数	上下文长度	下载
DeepSeek-V2-Lite	16B	2.4B	32千	https://www.wpsshop.cn/w/煮酒与君饮/article/detail/878710 推荐阅读 article 比肩Midjourney-v6！没有GPU也能跑可图Kolors_可图 github... 比肩Midjourney-v6，快手的文生图开源模型可图Kolors一发布，开源社区就炸开了锅。短短几天，可图在Gith... 赞踩 article Git-版本控制,GitHub,Git分支_git发布版本... Git介绍啦, 版本控制, GitHub , Git分支,Git还有分支的一些基本操作啦啦啦, 大家点个赞啦~~关注一下... 赞踩 article 在 VS Code 中使用 GitHub Copilot_vs code github copilo... GitHub Copilot 是一个可以帮助你更简单、更快速地编写代码的工具，由 GPT-3 提供支持。你只需编写所需代... 赞踩 article Git \| SSH 密钥连接到 GitHub... Git 如何使用SSH 远程连接GitHub总结Git \| SSH 密钥连接到 GitHub ... 赞踩 article 开源社区活跃度分析——api.github.com的使用_索github上的开源代理api并使用... 开源社区活跃度分析——api.github.com的使用_索github上的开源代理api并使用索github上的开源代... 赞踩 article 用Python操作github api创建仓库，上传index.html文件，并创建github p... 想使用github token创建一个一条龙的服务，那就是创建仓库，添加index文件，并发布github page页... 赞踩 article 打造App-GitHub 开放API大总结_github api 搜索... 文章目录1. 登陆2. 关于我的-API2.1 我的个人主页2.1.1 请求说明2.1.2 返回响应2.2 我的关注 F... 赞踩 article GitHub Api用户和仓库常用接口... 准备工作官方文档：https://docs.github.com/en/rest/reference1、申请github... 赞踩 article 推荐：GitHub API 客户端 gem... 推荐：GitHub API 客户端 gem如果你是一个 Ruby 开发者，并且需要与 GitHub 进行交互，那么 Gi... 赞踩 article 探索 GitHub 上的自动和集成 API_github api... 例如，我们可以通过脚本监控特定的聊天渠道或外部问题的系统，解决相关的新问题，或使用 GitHub 上自动发布的 API ... 赞踩 article hexo+git+github+域名搭建个人博客提示404_教程 \| 一文搭建你的第一个免费专属博客... 我建了一个QQ学习交流群，旨在“分享、讨论、学习、资源分享、就业机会、互联网内推、共同进步！”，感兴趣的可以加一下，也可... 赞踩 article 【AIGC调研系列】Github Copilot进行pytest自动化测试的实践经验_github自... 本文探讨了GitHubCopilot如何与pytest框架结合，通过注释和命令快速生成测试代码，提升测试效率。重点介绍了... 赞踩 article github 思维导图开元软件_最强大脑！这 7 款开源思维导图工具真的很神奇... 这 7 款开源思维导图工具真的很神奇1、Kity Minder百度脑图，免安装在线使用，它有着很多 Native 编辑工... 赞踩 article Android Studio使用git(github)_android studio git... 文章目录虽然AS具有git的功能,不过在git之前还是要经过git add 和git commit 之类的与操作才可以p... 赞踩 article Android Studio使用Git以及连接到远程库（GitHub）_androidstudio实... 目录前言Git下载Android Studio中使用Git添加Git目录新建Git仓库修改.gitignore文件“ad... 赞踩 article 2023 年该学点什么技术？「GitHub 热点速览 v.23.03」... 作者：HelloGitHub-小鱼干春节期间，小鱼干读了一篇万字回顾数据库行业的文章，在文字缝隙里我看见了两个词：AI+... 赞踩 article 让 AI 为你写代码 - 体验 Github Copilot_ai写代码 copilot... 到这里我已经有点无话可说了。copilot 深深的震撼了我，感觉 copilot 对注释的理解根据人类无差别，生成的代码... 赞踩 article 本周23个Github有趣项目llama-agents等_omniparse github... 无论您处理的是文档、表格、图像、视频、音频文件还是网页，OmniParse 都可以将您的数据准备得干净、结构化，并可用于... 赞踩 article DeepSeek-V2: A Strong, Economical, and Efficient M... 过去几年，大型语言模型 (LLM) 经历了快速发展，让我们看到了通用人工智能 (AGI) 的曙光。一般来说，LLM 的智... 赞踩 article 单节点8xA800跑起来HuggingFace DeepSeek V2踩坑_a800单节点通信... 尝试跑起来HuggingFace上release的DeepSeek V2，踩了几个坑，这里给出解决的方法。Hugging... 赞踩相关标签 midjourney 可图 SiliconCloud bizyair Kolors git github 前端 copilot ssh 开源 html restful hexo+git+github+域名搭建个人博客提示404 AIGC github 思维导图开元软件 android Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。闽ICP备14008679号