赞
踩
感谢@贪心科技 @李文哲 老师,附NLP系列第一场《词向量与ELMo》笔记整理
btw, 后面的课程笔记我也会整理到知乎,需要的小伙伴可以关注欧~
2. 词向量之生成词向量的模型和方法
3. 语言模型
然而,通过以上方法学得的词向量都是固定的(fixed),造成的缺陷是,无法表示在不同语境下的含义不同的单词,如apple;
ELMo是一种deep- BLSTM的方法,采用双向双层的LSTM结构,可以动态的学出在上下文中的词向量:
给定输入序列,双向LSTM通过前向和后向两个单向LSTM(方向相反的)分别生成表示,然后简单拼接,得到最终的表示。
ELMo的网络结构是双向双层LSTM,其中的每一层都包含前向和后向两个LSTM层,
在将句子输入模型中在线提取各层embedding的时候,每个单词(token)对应前向和后向两个LSTM网络的对应节点,由这两个节点产生的embedding是动态变化的;受到上下文单词的影响,周围单词的上下文不同应该会强化某种语义,弱化其它语义,这样就达到区分多义词的效果了。
深度学习的层次表示使得不同深度的隐层编码的特征信息不同;对于文本来讲,从简单到复杂的特征可以理解为:单词特征->句法特征(主谓宾等)->语义特征;
NLP详细教程:手把手教你用ELMo模型提取文本特征,附代码&论文
NLP详细教程:手把手教你用ELMo模型提取文本特征,附代码&论文 - 云+社区 - 腾讯云cloud.tencent.com个人认为不必硬记,在开展实践中理解就好;
感谢@贪心科技 @李文哲 老师;
后面的课程笔记我也会整理到知乎,需要的小伙伴可以关注欧~
交流学习:)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。