赞
踩
如火如荼的AI竞赛,亚马逊云科技也下场了。有些不同的是,除了自己构建的AI模型,他们还招募第三方在亚马逊云科技上托管模型。毫无疑问,亚马逊云科技在掀起一场颠覆性变革。
AIGC的「基石」:基础模型
过去的十多年里,人工智能领域大部分研究集中在训练神经网络来完成一项特定的任务。比如在CV中,图像分类、分割、或者识别图中是否是一只猫;在NLP中,语义检索、翻译等等。直到ChatGPT的横空出世,甚至可以说最早从StableDiffusion开始,生成式AI的能力逐渐打破人们原有的认知。
正是GPT-3、DELL-E、GPT-4等超大模型兴起,让语言模型的训练范式发生了重大变化。模型训练过程不再过度依赖显性标注,能够根据句子中已有单词,预测一下词,实现了智能体的认知能力进步。因为在大量的数据上进行了预训练,基础模型已具有了高度适应性,能够完成一系列下游任务。基础模型的优势就在于,可以被用于微调的特定领域,或者创建一个业务模型的起点。在理解数行为方面,FM当然是最好的。微调模型,就需要在特定数据集(有标注)进一步训练而来的模型。而这种数据集是解决特定任务所需的,因为大模型只能做到「很懂」,但不能做到「很专」。
微调后的模型结合了2点优势:一是对数据结构的理解,再一个是通过标注数据的形式了解业务问题的背景。基础模型是生成式AI的关键
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。