机器学习的出现，是否意味着“古典科学”的过时？

作者：小丑西瓜9 | 2024-04-04 20:44:15

踩

机器学习的出现

作者：Laura Spinney

译者：刘媛媛

原文：Are we witnessing the dawn of post-theory science?

让我们回忆一下，Isaac Newton 被一个苹果砸中头部，然后是怎么提出牛顿第二定律——万有引力的？

大概过程是这样的：大量的实验和数据分析之后，他意识到，力、质量和加速度之间存在根本的关系。然后他制定了一种理论来描述这种关系，表示为一个方程“F=ma”，并用它来预测苹果以外的物体的行为。事实证明，他的预测是正确的（这对于不要求精确度的人们来说是足够）。

现在，我们再来对比一下当今科学发展的新潮流：Facebook 的机器学习工具比任何心理学家都更能预测你的偏好；DeepMind 开发的 AlphaFold，可以根据蛋白质所含的氨基酸对蛋白质结构做出了迄今为止最准确的预测。

它们的诞生对于科学界的研究范式来说究竟意味着什么？换句话说：获取知识的最佳方式是什么？科学又从何而来？

人类的不安

Facebook 和 AlphaFold 没有提供任何理论解释。这些算法只是完成工作并且效果还不错。我们每天都在见证 Facebook 预测的社会影响。AlphaFold 的影响尚未显现，但许多人相信它将改变医学。

一时间，它们的理论基础似乎隐居二线。

2008 年，时任 Wired 杂志的主编 Chris Anderson 预言了一种理论的消亡。他认为，现在已经积累了如此多的数据，而计算机在发现数据间的关系方面比人类表现的更好。很快，古老的科学方法，即假设、预测、检验，将被扔进历史的垃圾箱。人们不再寻找事物的本质原因，而是满足于数据间的相关性。

事后看来，Anderson 所看到的情况是真实的。大量数据的复杂性无法被我们传统理解的理论所捕捉。

德国马克斯普朗克生物控制论研究所所长、计算神经科学家 Peter Dayan 说：“因为不知道它们会是什么样子的，所以我们甚至没有能力写出对描述有用的理论。”

但 Anderson 对理论终结的预测似乎为时过早。尽管 Facebook 和 AlphaFold 这样的无理论基础的预测引擎取得了成功，但理论不会消亡，此处有以下三个原因。

第一个原因是，我们已经意识到 AI，尤其是神经网络这种机器学习形式，无需接受明确的指令即可从数据中学习，它们本身是容易出错的。想想谷歌搜索引擎和亚马逊招聘工具中记录的偏见就可以明白。

第二，人类对没有理论基础的科学方法深感不安。我们就是不喜欢和黑匣子相处。

第三，可能仍然有很多传统类型的理论（即人类可以理解的）可以有效地解释很多事情，只是尚未被发现。

所以理论还没有消亡，但它正在改变——也许还会变得面目全非。普林斯顿大学心理学家 Tom Griffiths 说：“拥有大量数据时的有意义的理论，与仅拥有少量数据时有意义的理论，看起来是完全不同。”

Griffiths 一直在使用神经网络来帮助改进他所在领域的现有理论，即人类决策。一个关于人们在涉及经济风险时如何做出决策的流行理论是前景理论，它由行为经济学家 Daniel Kahneman 和 Amos Tversky 在 1970 年代提出的（后来 Kahneman 获得了诺贝尔奖）。其核心理念是：人并非总是理性的。

图2 Daniel Kahneman，人类行为前景理论的创始人之一

在 2021 年 6 月的 Science杂志上，Griffiths 的小组描述了他们如何在一个庞大的决策数据集上，训练一个神经网络模型，该数据集包含在 10,000 个有风险的选择场景中人们做出的决策，然后比较模型预测有关前景理论的进一步决策的准确度。他们发现前景理论做得很好，但是神经网络在突出理论失败的地方（即预测失败的地方）显示出它的价值（参见“数据实战派”往期报道）。

Griffiths 认为，这些反例反映的信息量更大，因为它们揭示了现实生活中存在的更多复杂性。例如，正如前景理论所描述的那样，人类不断地根据传入的信息权衡概率。但是，当大脑要计算的竞争概率太多时，他们可能会转向不同的策略。例如，受经验法则的指导，股票经纪人的经验法则，可能与青少年比特币交易员的经验法则不同，因为它来自不同的经验。

“我们基本上是在使用机器学习系统，来识别那些观察与理论不一致的情况”，Griffiths 说。

数据集越大，人工智能学习的不一致就越多。最终得到的结果，不是传统意义上的关于人们如何做出决定的精确主张的理论，而是一组受某些约束的主张。

一种描绘它的方式可能是“如果...那么...”类型规则的分支树，这很难用数学来描述，更不用说用语言描述了。

可理解和预测性之间的权衡

人类也不是第一次面临这种局面了。

1980 年代，语音识别软件先驱 Frederick Jelinek 曾说说：每解雇一名团队中的语言学家，语音识别器的性能就能获得提高。

他的意思是，对理论的执着某种程度上阻碍了实践上的进步。

以预测而蛋白质结构的例子来说明。蛋白质的功能很大程度上取决于它的结构，因此，如果你想设计一种药物来阻断或增强给定蛋白质的作用，你需要了解它的结构。

AlphaFold 使用 X 射线晶体学等技术，对实验推导的结构进行了训练，目前它对于有一些实验数据的蛋白质的预测，比那些没有实验数据的蛋白质的预测更可靠。

欧洲生物信息学研究所 (EMBL-EBI) 前主任 Janet Thornton 说：”模型的可靠性是一直在提高的。缺少理论并不会阻止药物设计师使用它，这只会增进我们对生命和治疗的理解。”