自然语言处理(NLP)是人类语言的自动或半自动处理。 NLP与语言学密切相关,并与认知科学,心理学,生理学和数学研究相关。 特别是在计算机科学领域,NLP与编译器技术,形式语言理论,人机交互,机器学习和定理证明有关。 这个Quora问题显示了NLP的不同优势 。
在本教程中,我将带您了解一个有趣的NLP Python平台,称为自然语言工具包(NLTK)。 在我们看到如何使用该平台之前,让我先告诉您什么是NLTK。
什么是NLTK?
自然语言工具包(NLTK)是用于构建文本分析程序的平台。 该平台最初由Steven Bird和Edward Loper连同2001年在宾夕法尼亚大学的计算语言学课程一起发布。该平台随附一本书,名为《 使用Python进行自然语言处理》 。
安装NLTK
现在,让我们安装NLTK,开始尝试自然语言处理。 这会很有趣的!
安装NLTK非常简单。 我使用的是Windows 10,因此在命令提示符( MS-DOS
)中键入以下命令:
pip install nltk
如果您使用的是Ubuntu或macOS,请从Terminal
运行命令。 有关在不同平台上安装NLTK的更多信息,请参见文档 。
如果您想知道什么是pip
,它是一个软件包管理系统,用于安装和管理以Python编写的软件包。 如果您使用的是Python 2> = 2.7.9或Python 3> = 3.4,则已经安装了pip
! 要检查您的Python版本,只需在命令提示符下键入以下内容: