赞
踩
InternLM-XComposer-2.5(IXC-2.5)是由上海人工智能实验室等机构开发的一款多功能大型视觉语言模型,支持长上下文输入和输出。该模型在多种文本图像理解和创作应用中表现出色,仅凭7B的LLM后端就达到了GPT-4V级别的能力。IXC-2.5通过24K交错图像-文本上下文的训练,能够无缝扩展到96K长上下文,特别适用于需要广泛输入和输出上下文的任务。
IXC-2.5在视觉语言理解方面进行了三项重大升级:超高清分辨率理解、细粒度视频理解和多轮多图像对话。此外,IXC-2.5还扩展了两个引人注目的应用,使用额外的LoRA参数进行文本-
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。