当前位置:   article > 正文

大模型的能力(datawhale 一起学)_大模型中各种能力是什么

大模型中各种能力是什么

注意:文章内容参考了斯坦福CS324 - Large Language Models课程,以及我们的Datawhale的一起学课程中的内容。

1、概述

在大模型的能力概述中,以GPT-3为例,主要就是描述了GPT-3在一些任务上的能力主要包括:

  • Language modeling(语言模型)
    Question answering(问答)
    Translation(翻译)
    Arithmetic(算术)
    News article generation(文章生成)
    Novel tasks(小说任务)

以及从语言模型到任务模型的转化(语言模型的适应性)。

2、语言模型——>任务模型

自然语言处理的世界中,语言模型是一种对token序列的分布。这样的模型能够用于评估序列,例如 p(

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/102159?site
推荐阅读
相关标签