DeepSeekAI发布多模态大模型DeepSeek-VL：从13亿到70亿参数的多模态精确度，免费商用_deepseek-vl-7b-chat

作者：繁依Fanyi0 | 2024-07-31 22:20:45

踩

deepseek-vl-7b-chat

前言

随着人工智能技术的不断发展，多模态大模型在理解复杂世界方面的能力日益增强。DeepSeekAI，一家由幻方量化支持的创新型大模型公司，最近发布了其最新的多模态大模型系列——DeepSeek-VL。该系列包含从13亿到70亿参数的模型，旨在提高机器对图像和文本的理解能力，同时支持广泛的商业应用。

DeepSeek-VL模型简介

DeepSeek-VL系列代表了在多模态AI领域的一大突破，提供了两种不同规模的模型，分别是13亿参数和70亿参数模型。这些模型利用了DeepSeekAI自研的语言模型DeepSeek-LLM和视觉编码器SigLIP-L的组合，能够处理不同分辨率的图像输入，其中70亿参数规模的模型支持1024×1024分辨率图像的输入，而13亿参数规模的模型支持384×384分辨率图像输入。二者的语言模型也有差异，前者是基于2万亿tokens数据集训练的DeepSeek-LLM-7B模型，而后者则是基于5000亿tokens数据集训练的DeepSeek-LLM-1.3B模型训练的。但是它们都是基于4000亿图像-文本对数据集训练得到的结果。

Huggingface模型下载：https://huggingface.co/deepseek-ai/deepseek-vl-7b-chat
AI快站模型免费加速下载：https://aifasthub.com/models/deepseek-ai/deepseek-vl-7b-chat

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/910958