LLM(Large Language Model)大语言模型_lld英文缩写large language

作者：我家小花儿 | 2024-06-19 23:21:51

踩

lld英文缩写large language

涌现：

语言模型够大，训练的语料够多，涌现出推理能力飙升等

Generative Pre-trained Transformer 3（GPT-3）是最著名的LLM之一，拥有1750亿个参数。该模型在文本生成、翻译和其他任务中表现出显著的性能，在全球范围内引起了热烈的反响，目前OpenAI已经迭代到了GPT-4版本

Generative ：能产生之前没有的模型
Pre：预训练
Transformer ：谷歌的Transformer深度神经网络架构，分层式，优势是允许神经网络搭建更深的分层。从而理解更长的语句。

Bidirectional Encoder Representations from Transformers（BERT）是另一个流行的LLM，对NLP研究产生了重大影响。该模型使用双向方法从一个词的左右两边捕捉上下文，使得各种任务的性能提高，如情感分析和命名实体识别。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/我家小花儿/article/detail/737889