当前位置:   article > 正文

中文实体识别(采用BERT)_python bert中文命名实体识别

python bert中文命名实体识别

中文实体识别(采用BERT

数据预处理

构建标签字典在这里插入图片描述

保存为pkl文件方便读取。
在这里插入图片描述

读取数据

  1. 字对应标签list序列
  2. 序列截断操作,不超过最大长度,否则就截断。在这里插入图片描述
  3. 处理为BERT对应的字符在这里插入图片描述
  4. 将字符转为id索引在这里插入图片描述
  5. 长度不够,需要填充0(在bert中,填充的0不会计算self-attention,需要用到mask)在这里插入图片描述

输入到BERT模型中

  1. (见BERT学习笔记)得到输出结果为[batch_size,leng,dim]在这里插入图片描述
  2. 对输出向量进行标签预测
    W维度[dim,标签类别]、b偏差值[11]
    经过全连接层非线性函数输出每一个字对应的预测类别结果向量[batch*len,11]
    在这里插入图片描述
    在这里插入图片描述

将结果输入到CRF中在这里插入图片描述

  1. 构建转移矩阵[num_class,num_class]在这里插入图片描述
  2. 计算似然函数在这里插入图片描述
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/648436
推荐阅读
相关标签
  

闽ICP备14008679号