当前位置:   article > 正文

昇思学习打卡-24-自然语言处理/LSTM+CRF序列标注

昇思学习打卡-24-自然语言处理/LSTM+CRF序列标注


序列标注指给定输入序列,给序列中每个Token进行标注标签的过程。序列标注问题通常用于从文本中进行信息抽取,包括分词(Word Segmentation)、词性标注(Position Tagging)、命名实体识别(Named Entity Recognition, NER)等。

常见的实体标识的方法有BMES标注法(四位序列标注法)、BIO标注法(三位序列标注法)、BIOES标注法(四位序列标注法),这里使用了一种常见的命名实体识别的标注方法——“BIOE”标注,将一个实体(Entity)的开头标注为B,其他部分标注为I,非实体标注为O。

条件随机场(Conditional Random Field, CRF)

考虑到序列标注问题的线性序列特点,本节所述的条件随机场特指线性链条件随机场(Linear Chain CRF)

score计算

在这里插入图片描述
首先根据公式 (3)
计算正确标签序列所对应的得分,这里需要注意,除了转移概率矩阵

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/873674
推荐阅读
相关标签