赞
踩
交叉熵、KL散度、极大似然估计与最大后验估计
词向量详解:从word2vec、glove、ELMo到BERT
RNN, LSTM
深度学习中Attention Mechanism详细介绍:原理、分类及应用