当前位置:   article > 正文

[nlp] 序列标注 BIO BIOES_怎么实现bioes手动标注

怎么实现bioes手动标注

BIO标注法:

B-begin,代表实体的开头

I-inside,代表实体的中间或结尾

O-outside,代表不属于实体

BIOES标注法:

B-begin,代表实体的开头

I-inside,代表实体的中间

O-outside,代表非实体,用于标记无关字符

E-end,代表实体的结尾

S-single,代表单个字符,本身就是一个实体

BIO标注举例

比如,我们将 X 表示为名词短语(Noun Phrase, NP),则BIO的三个标记为:

(1)B-NP:名词短语的开头

(2)I-NP:名词短语的中间

(3)O:不是名词短语

因此可以将一段话划分为如下结果;

 我们可以进一步将BIO应用到NER中,来定义所有的命名实体(人名、组织名、地点、时间等),那么我们会有许多 B 和 I 的类别,如 B-PERS、I-PERS、B-ORG、I-ORG等。然后可以得到以下结果:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/592333
推荐阅读
相关标签
  

闽ICP备14008679号