赞
踩
双向 编码器 加上mask做完形填空超大模型无监督预训练 需要整个模型作为pretrain weight到下游任务做fintune
自回归 解码器 无需训练 只需Prompt
BERT需要全部参数进行训练 GPT不需要训练即可完成下游任务
BERT使用双向的编码器
GPT使用自回归的解码器
总结个毛