赞
踩
注意:文章内容参考了斯坦福CS324 - Large Language Models课程,以及我们的Datawhale的一起学课程中的内容。
在大模型的能力概述中,以GPT-3为例,主要就是描述了GPT-3在一些任务上的能力主要包括:
Language modeling(语言模型)
Question answering(问答)
Translation(翻译)
Arithmetic(算术)
News article generation(文章生成)
Novel tasks(小说任务)
以及从语言模型到任务模型的转化(语言模型的适应性)。
在自然语言处理的世界中,语言模型是一种对token序列的分布。这样的模型能够用于评估序列,例如 p(
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。