赞
踩
在自然语言处理中,提取人名通常是一项基本任务。在人名信息的抽取中,Python具有很多应用场景。Python的自然语言处理库nltk和spacy都能实现这个功能。本文将介绍如何使用nltk和spacy库提取文本中的人名。
首先,我们需要安装nltk库。在命令行中运行以下命令即可:
pip install nltk
安装完毕后,我们需要下载nltk的数据集。在Python解释器中运行以下命令:
import nltk
nltk.download('names')
接下来,让我们来看看具体的代码实现:
import nltk
# 加载nltk names数据集
names = nltk.corpus.names
# 获取male.txt和female.txt中的名字
male_names = names.words('male.txt')
female_names = names.words('female.txt')
# 定义函数,从文本中提取人名
def extract_names(text):
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。