赞
踩
整个NER任务分为了多个子模块,每个子模块负责学习不同类型的信息,信息是关于NER任务的,比如,边界检测、类型检测。
模块交互中,需要注意、学习和实现,是采用了gate机制的方法,不是简单的concat方式。
对于 NER 任务,边界检测和类型预测可以相互配合,这两个子任务通过共享信息相互加强也很重要。
一种新颖的模块化交互网络 (MIN) 模型,它同时利用段级信息(segment information )和词级依赖关系(word-level information),并结合交互机制来支持边界检测和类型预测之间的信息共享,以提高 NER 的性能任务。
(边界模块中,实体头指向实体尾;其余的非实体词指向了最后一个词)
the NER Module (主干模型), Boundary Module(子模型), Type Module(子模型) and Interaction Mechanism(交互机制)
主干模型
训练一个实体的start 指向end位置,其余的word指向一个无意义的标记词。
具体过程
应用了无方向LSTM作为decoder,得到每个step的表示。LSTM的输入是:current,previous and next的word表示。
之后,采用 * biaffine attention * 得到每个position的表示,在通过softmax函数得到每个segment是否start with word wj和end with wi.
最终的segment的表示获取: 计算过程中,使用了概率函数作为判断wi和wj是否为边界的计算公式:we use the probability p (wi|wj ) as the confidence of the segment that starts with word wj and ends with word wi
类型模块的信息表示采用BiLSTM得到相应的表示:
边界信息和类型信息两者之间可以彼此交互。
注意力机制:biaffine attention mechanism
注意力分值计算:
更新后的边界表示:
三个模块的损失函数:
模型的总损失是:三个loss之和。NER+Type+Boundy
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。