当前位置:   article > 正文

三种命名实体标注方法,BIO三元标注、BMES四元标注及BIOES五元标注_bio标注

bio标注

一、BIO  三位标注  (B-begin,I-inside,O-outside)

B-X 代表实体X的开头, I-X代表实体的结尾  O代表不属于任何类型的

其中,“B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型。

      比如,我们将 X 表示为名词短语(Noun Phrase, NP),则BIO的三个标记为:

(1)B-NP:名词短语的开头

(2)I-NP:名词短语的中间

(3)O:不是名词短语

二、BMES  四位序列标注法

B表示一个词的词首位值,M表示一个词的中间位置,E表示一个词的末尾位置,S表示一个单独的字词。

我/S 是/S 广/B 东/M 人/E    (符号标注,‘东’是‘广’和‘人’的中间部分,凑成‘广东人’这个实体)

我/ 是/ 广东人/        (标注上分出来的实体块)

三、BIOES   (B-begin,I-inside,O-outside,E-end,S-single)

B 表示开始,I表示内部, O表示非实体 ,E实体尾部,S表示改词本身就是一个实体。

 B表示这个词处于一个实体的开始(Begin), I 表示内部(inside), O 表示外部(outside), E 表示这个词处于一个实体的结束为止, S 表示,这个词是自己就可以组成一个实体(Single)

BIOES 是目前最通用的命名实体标注方法。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/592339
推荐阅读
相关标签
  

闽ICP备14008679号