赞
踩
随着人工智能技术的不断发展,多模态大模型在理解复杂世界方面的能力日益增强。DeepSeekAI,一家由幻方量化支持的创新型大模型公司,最近发布了其最新的多模态大模型系列——DeepSeek-VL。该系列包含从13亿到70亿参数的模型,旨在提高机器对图像和文本的理解能力,同时支持广泛的商业应用。
DeepSeek-VL系列代表了在多模态AI领域的一大突破,提供了两种不同规模的模型,分别是13亿参数和70亿参数模型。这些模型利用了DeepSeekAI自研的语言模型DeepSeek-LLM和视觉编码器SigLIP-L的组合,能够处理不同分辨率的图像输入,其中70亿参数规模的模型支持1024×1024分辨率图像的输入,而13亿参数规模的模型支持384×384分辨率图像输入。二者的语言模型也有差异,前者是基于2万亿tokens数据集训练的DeepSeek-LLM-7B模型,而后者则是基于5000亿tokens数据集训练的DeepSeek-LLM-1.3B模型训练的。但是它们都是基于4000亿图像-文本对数据集训练得到的结果。
Huggingface模型下载:https://huggingface.co/deepseek-ai/deepseek-vl-7b-chat
AI快站模型免费加速下载:https://aifasthub.com/models/deepseek-ai/deepseek-vl-7b-chat
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。