赞
踩
自回归模型可以类比早期的统计语言模型,根据上下文预测下一个单词。
自编码模型(如BERT),在输入中随机掩盖一个单词,在与训练过程中,根据上下文,预测被掩盖的单词。这种行为可以视为是降噪(denosing)。
常见自回归模型:ELMo、GPT、XLNet 常见自编码模型:BERT、ERINE、RoBERTa