赞
踩
什么是NLP,在与NLP相关的求职面试中,你可能会遇到哪些问题?
自然语言处理(NLP)很火爆,如果你对NLP感到好奇并愿意学习更多,甚至想从事相关工作,了解可能会遇到的面试问题会对你找工作有所帮助。
维基百科很好地解释了,自然语言或普通语言是指人类通过使用和重复自然演化而来的任何语言,没有经过有意识的规划或预谋。
上述定义中的关键词是“人类”。在NLP中,还有一个关键词:计算机。从这个关键词中得出的定义是,NLP涉及教计算机如何理解自然语言。由于它是一台计算机,这种理解意味着处理和分析以不同数据格式存储的自然语言数据。
为了做到这一点,NLP结合了人工智能、计算机科学和语言学的知识。
NLP正成为我们日常生活的一项特性。当我写前面那句话时,谷歌的智能撰写功能建议了短语“日常生活”,我接受了。因为那正是我想写的。
那么这就是NLP的其中一种用途:自动更正、自动补全和拼写检查。NLP软件会扫描文本中的语法和拼写错误,并进行更正或提供纠正建议。还有一些拼写检查工具可以“理解”整个句子的句法、上下文和含义。基于这些信息,它们会根据你在文本中试图实现的目标,提供纠正或表达更佳的句子。
语言翻译是NLP的另一个用途。当你身处国外时,你可能会使用诸如谷歌翻译之类的翻译工具。此外,翻译工具在社交媒体平台上,如Facebook、Instagram和Youtube,也越来越常见。
识别和生成语音也是NLP的应用之一。想想谷歌助手、Windows语音识别、Dragon、Siri、Alexa或Cortana,当你说话时,它们似乎都(或多或少)能听懂你。根据你告诉它们的内容,它们将执行相应的操作,比如浏览互联网、输入你的文字或播放你喜爱的歌曲。其中一些工具甚至可以与你交谈,也就是生成语音。
NLP还可以解读文本的“情感”。换句话说,它们可以检测文本背后的情感,而不仅仅是字面意义。这意味着理解情绪(快乐、愤怒、烦恼、中立...)、讽刺、双关语、隐喻和上下文中的表达方式。这就是所谓的情感分析。想象一下,通过分析社交媒体评论来理解用户的满意度,或者通过分析评论和评价来删除违反服务条款的内容。
NLP在在线营销中被广泛使用。你搜索的关键词与公司、产品和广告的关键词进行匹配。所以当你开始看到刚刚在谷歌搜索过的产品的广告时,不要担心。你并没有发疯,这就是NLP和定向广告的工作原理。
数据分析师可能对自然语言本身并不感兴趣。但是,如果将计算机处理与自然语言结合起来,将自然语言转化为数据,就可能引起数据分析师的注意。
也许这对数据分析师来说还不足以引起他们的兴趣,但是如果他们知道机器学习(ML)与NLP有重叠并且通常在NLP中使用,情况可能会改变。
在上述NLP的用途背后通常隐藏着机器学习(ML)。而ML无疑是一个与数据科学紧密相关的领域。
当谈论到ML时,通常会区分有监督学习和无监督学习。
在NLP中最常用的有监督学习模型有:
支持向量机(SVM)
贝叶斯网络
最大熵模型
条件随机场
神经网络
无监督学习在NLP中并不常见,但仍然使用了一些技术,如:
聚类
潜在语义索引(LSI)
矩阵分解
在每个ML模型和算法背后,都有潜在的统计概念。
这两个领域在寻找数据分析师的所有认真公司中都会进行深入测试。处理NLP的公司也是如此。
对于NLP来说,可能特定的是某些术语,你应该了解这些术语。
将我在这里提到的一切作为你的面试准备的三个主要主题。
前面的讨论自然而然地引出了NLP面试问题的分类:
通用和NLP术语问题
统计问题
建模问题
这些NLP面试问题涉及你对NLP是什么、它是如何工作的以及NLP特定的技术概念的了解。
如果你没有NLP的工作经验,对这些问题要非常认真地进行准备。
一些问题示例:
自然语言处理(NLP)项目的生命周期有哪些阶段?
一些常见的NLP任务有哪些?
词干提取和词形归并有什么区别?
什么是信息抽取?
NLP中的情感分析是什么?
列举一些开源的NLP库。
统计问题测试你对统计概念的了解,这些概念在一般情况下作为数据分析师以及在NLP项目中的工作中经常使用。
以下是一些示例:
贝叶斯统计与频率派统计:贝叶斯统计与频率派统计有什么区别?
隐藏马尔可夫随机场是什么?
皮尔逊相关系数:证明为什么皮尔逊相关系数介于-1和1之间。
在NLP中,你所说的困惑度是什么意思?
第三类NLP面试问题涉及机器学习和一般模型。这可能涉及到NLP中最常用的机器学习算法(如上所述),以及NLP中使用的一些其他特定技术和方法。
以下是一些示例:
GPT和GPT-2之间有什么区别?
你喜欢特征提取还是微调?你是如何决定的?你会将BERT用作特征提取器还是微调它?
在NLP中,你所说的掩码语言建模是什么意思?
PCA和LDA/QDA之间的关系是什么?
朴素贝叶斯分类器中的“朴素”指的是什么?
自然语言处理是一个在日常生活中越来越广泛使用的领域。目前的应用包括拼写检查、自动补全工具、翻译器、语音识别和生成软件。NLP在社交媒体监控和在线营销中也得到广泛应用。
NLP与机器学习有重叠,因此许多机器学习知识也适用于NLP。
NLP是一个广阔而具体的领域,需要了解非常具体的术语、技术和常用方法。
总的来说,面试问题可以分为通用NLP问题、统计问题和建模问题。
我上面给出的示例和资源只是一个开始。但即使这些已经足够让你放心参加NLP的工作面试了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。