赞
踩
本文是LLM系列文章,针对《MM-LLMs: Recent Advances in MultiModal Large Language Models》的翻译。
在过去的一年里,多模态大型语言模型(MM-LLM)取得了长足的进步,通过具有成本效益的训练策略,增强了现成的LLM,以支持MM的输入或输出。由此产生的模型不仅保留了LLM固有的推理和决策能力,而且还赋予了各种MM任务权力。在本文中,我们提供了一个全面的调查,旨在促进MM LLM的进一步研究。最初,我们概述了模型架构和训练管道的一般设计公式。随后,我们介绍了一个包含122个MM LLM的分类法,每个LLM都有其特定的配方。此外,我们回顾了选定的MM LL
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。