当前位置:   article > 正文

python使用HanLP命名实体识别(以识别人名为例)_hanlp命名实体识别实践

hanlp命名实体识别实践

首先需要安装依赖包:pip install pyhanlp

识别人名的代码如下:

from pyhanlp import HanLP


def extract_chinese_name(string: str) -> list:
    """使用HanLP人名识别"""
    if (string is None) or (string == ""):
        return []
    segment = HanLP.newSegment().enableNameRecognize(True)
    user_list = []
    for i in segment.seg(string):
        split_words = str(i).split('/')  # check //m
        word, tag = split_words[0], split_words[-1]
        if tag == 'nr':
            user_list.append(word)
    return user_list


if __name__ == '__main__':
    user_list = extract_chinese_name("《八佰》(英語:The Eight Hundred)是一部于2020年上映的以中国历史上的战争为题材的电影,由管虎执导,黄志忠、张俊一.....")
    print(user_list) # ['管虎', '黄志忠', '张俊']
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20

这里的nr就表示人名的含义,Hanlp使用隐马模型进行分词,词性标注表可以参考:https://www.hankcs.com/nlp/part-of-speech-tagging.html

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/一键难忘520/article/detail/930614
推荐阅读
相关标签
  

闽ICP备14008679号