赞
踩
导读:在业界,近些年来机器学习在人机对弈、语音识别、图像识别等场景下取得了蓬勃发展,引发了人们对人工智能改造未来社会的无限热情和期待。但在学界,却有不少科学家指出了机器学习的发展局限。加拿大滑铁卢大学教授Shai Ben-David探索的就是这样一个机器学习的本质问题:我们能不能判定人工智能的可学习性?
Shai Ben-David通过研究给出的答案是:不一定!他指出,如果一个问题只需要“是”或“否”的回答,我们还是可以确切地知道这个问题可否被机器学习算法解决。但是,一旦涉及到更一般的设置时,我们就无法区分可学习和不可学习的任务了。
那么机器学习都能解决哪些问题?让我们回归本质,探讨一下机器学习最基础知识及应用。
作者:沙伊·沙莱夫施瓦茨(Shai Shalev-Shwartz)、沙伊·本戴维(Shai Ben-David)
如需转载请联系华章科技
我们首先来看几个存在于大自然的动物学习的例子。从这些熟悉的例子中可以看出,机器学习的一些基本问题也存在于自然界。
1. 怯饵效应——老鼠学习躲避毒饵
当老鼠遇到有新颖外观或气味的食物时,它们首先会少量进食,随后的进食量将取决于事物本身的风味及其生理作用。如果产生不良反应,那么新的食物往往会与这种不良后果相关联,随之,老鼠不再进食这种食物。很显然,这里有一个学习机制在起作用——动物通过经验来获取判断食物安全性的技能。如果对一种食物过去的经验是负标记的,那么动物会预测在未来遇到它时也会产生负面影响。
前文的示例解释了什么是学习成功,下面我们再举例说明什么是典型的机器学习任务。假设我们想对一台机器进行编程,使其学会如何过滤垃圾邮件。一个最简单的解决方案是仿照老鼠学习躲避毒饵的过程。机器只须记住所有以前被用户标记为垃圾的邮件。当一封新邮件到达时,机器将在先前垃圾邮件库中进行搜索。如果匹配其中之一,它会被丢弃。否则,它将被移动到用户的收件箱文件夹。
虽然上述“通过记忆进行学习”的方法时常是有用的,但是它缺乏一个学习系统的重要特性——标记未见邮件的能力。一个成功的学习器应该能够从个别例子进行泛化,这也称为归纳推理。在“怯饵效应”例子中,老鼠遇到一种特定类型的食物后,它们会对新的、没见过的、有相似气味和口味的食物采取同样的态度。
为了实现垃圾邮件过滤任务的泛化,学习器可以扫描以前见过的电子邮件,并提取那些垃圾邮件的指示性的词集;然后,当新电子邮件到达时,这台机器可以检查它是否含有可疑的单词,并相应地预测它的标签。这种系统应该有能力正确预测未见电子邮件的标签。
但是,归纳推理有可能推导出错误的结论。为了说明这一点,我们再来思考一个动物学习的例子。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。