当前位置:   article > 正文

人类的认知架构

global workspace theory

497764c8e69b5b4c28bf548a2ca07d91.png

导读:

伴随着具身主义思想的发展,以及多智能体交互需求的不断上升,促使了对环境中个体的认知架构研究。科学家们一直试图将人类的心智(Mind)理论化,并通过形式化建模的方式来构建认知架构。以实现人工智能。认知科学和神经科学近几十年的研究已经表明,大脑是模块化的,不同的区域具有特异的不同功能,例如人脑的梭状回面孔区(fusiformfacearea,FFA)负责面孔的识别,韦尼克区(Wernicke'sarea)负责语言语义理解,额叶眼动区(frontaleyefields,FEF)负责扫视运动等等。那么,这些区域如何相互配合,完成“在嘈杂的人群中看到熟人,听到他说话时盯住嘴巴,同时利用嘴型和不甚清楚的声音听懂他在跟你打招呼并走过去聊天”这样的日常行为呢?这就涉及到了我们将要介绍的全局工作空间理论(GlobalWorkspaceTheory,GWT)[6,7]。

030bf70f26b96ee3cbf1ff6923e62f14.png

全局工作空间理论是由美国心理学家BernardBaars在上世纪80年代提出的一种认知架构,它最初作为一种意识模型而被提出,是现代认知科学的一个重要理论。该理论认为,大脑可以分成一些具有特定功能的模块,当感知觉输入或任务需求激发了某些模块的响应之后,这些响应会相互竞争,通过选择性注意机制,某些信息会进入全局工作空间,并在不同模块之间进行广播(broadcast),以此完成不同模块之间的信息交流,并合作完成不同的任务。而当信息进入全局工作空间并分发到其他模块时,意识就此产生(图1.6)。GWT理论通常可以用“剧场隐喻”(theatermetaphor)来理解[8](图1.7)。在“意识剧场”中,选择性注意像聚光灯一样照亮了舞台上的一个区域。这个亮点揭示了意识的内容:演员们进行表演、演讲或者相互交流。导演、编剧、场景设计师等工作人员藏在幕后的黑暗中,他们塑造了舞台上的可见活动,但它们本身是不可见的。舞台中正在上演的内容也被播送给同样处在黑暗中的观众(即大脑的其他部分)。

22b3b9dcb09bc74a3a97d0f32e2f5586.png

Dehaene和Changeux等人提出了一个全局工作空间架构的神经元版本,即所谓“全局神经元工作空间”(GlobalNeuronalWorkspace,GNW)[9,10]。在他们的模型中,一些局部的、专用的、模块化的皮层区域构成了一个单独的计算空间,各个模块可能具有各自的层级结构,但不同部分可以并行、分布式处理特定的信息,如感知觉、运动、记忆等等。第二个计算空间是由一些广泛分布的兴奋性神经元(称为GNW神经元)和具有长程连接的轴突组成,能够通过下行连接选择性地调动或抑制特定模块传入的信息。在他们的模型中,这种分布式的神经元群体具有自下而上接收信息并将自上而下的信息传输给任何一个处理器的能力,从而选择和广播信息(图1.8)。这种大范围广播允许不同的认知模块都能够接收到信息,被认为有助于未知问题的解决,例如通过调动不同的信息处理模块进行竞争或合作,从而更容易找到解决问题的路径。

2fd5c8df6f109a3abb0be37a252d8461.png

GNW的激活是非线性的,具有“全或无”(all-or-none)的特性,即一旦有信息进入,便会迅速诱发全局工作空间的广播,这称作“引燃”(ignition),这种现象已经在人和动物的实验中得到了证实(图1.9)。引燃可能由外部刺激所触发,例如黑暗里的一盏灯、周围车辆的鸣笛;或者受正在执行的任务相关脑区触发,例如在回忆时发生“知晓感”(feelingofknowing),话到嘴边却无法提取记忆内容;甚至可能在休息时自发随机产生。GNW还具有独占性(exclusive),某群神经元的激活能够抑制其余的神经元,如果某个模块的信息激活了全局的活动模式,其他模块的信息将无法进入全局工作空间,因此全局工作空间只能够串行处理信息,并且不同子系统之间会存在竞争。这种机制符合意识的一些特征,例如状态单一,容量有限、顺次发生,也能够解释诸如非注意盲视(InattentionalBlindness)、注意瞬脱(AttentionalBlink)等认知现象。

GNW如同一个分布式路由器,同各个脑区的无数神经元存在关联,从而可以放大、维持信息,并提供给各个信息处理模块和丘脑皮层环路使用。大脑的前额叶皮层(prefrontalcortex,PFC)、背外侧前额叶皮层(dorsolateralprefrontalcortex,DLPFC)、下顶叶皮层(inferiorparietalcortex)、前颞叶皮层(anteriortemporalcortex)、前后扣带回皮层(anterior/posteriorcingulatecortex,ACC/PCC)、楔前叶(precuneus)等脑区,各自有其独特的功能和连接模式,但相互之间存在广泛的连接,任何一个区域获取的信息都可以迅速提供给其他脑区。这些脑区之间密切的双向连接为引燃(ignition)创造了条件,从而能够触发突然的、集体的协同活动在全脑广播。

70d126951ea914d3decb6aa91a84d9db.png

2017年,ChristofKoch团队在小鼠的屏状核(claustrum)发现了三个巨大神经元(GiantNeuron)[14],这些神经元跨越大脑的两个半球,缠绕在整个大脑周围,与大脑负责感觉信息、负责行为反应的许多区域都有连接,在神经元层面符合全局工作空间的特征,被认为可能是意识的开关。

GWT不仅仅是一个概念模型,Dehaene,Changeux等人提出的神经元动力模型(Dehaene-ChangeuxModel,DCM)即为GNW的一种计算机模拟[15]。通过分别建模单个神经元、丘脑皮层柱网络和具有长程连接的由网络组成的网络(图1.10),DCM模拟了生物脑中观测到的丘脑-皮层震荡,以及网络自发或刺激诱发的引燃(ignition)等现象。

aa04e4617fe22b70491082d6936c5a84.png

Franklin等人在全局工作空间理论的基础上构建了一个更加通用的认知架构,称为学习型智能分配代理(LearningIntelligentDistributionAgent,LIDA),是一种生物学启发的综合性、可以计算实现的概念模型[16]。LIDA模型以LIDA认知循环(cognitivecycle)为基础(图1.11)。LIDA把认知循环看作是一个认知原子,其中包含了更高层次的认知过程、思考、推理、问题解决、计划、想象等。每个认知循环分为三个阶段:感知理解阶段、注意阶段以及动作选择和学习阶段,各个阶段分别由若干相互作用的模块构成,如图1.11所示。在每个认知周期中,LIDA智能体首先通过更新其对环境外部和内部特征的表示,尽可能好地理解其当前的状况(currentsituationalmodel)。通过一种竞争过程,它决定哪些信息最需要注意,并将这些信息广播,使其成为当前意识的内容,于是智能体能够选择适当的行动去执行。需要指出的是,LIDA认知循环中的各个模块并不与大脑中的功能模块直接对应,它们更多的是一种思维或心智意义上的功能模块。虽然模块在图中用明显的边界表示,但它们有非常丰富的交互,可能很难清晰的拆分开。另外,在LIDA模型中,除了意识和行为选择部分以外,其他过程都可以异步、并行的处理。

LIDA模型实现并充实了全局工作空间理论,并且涵盖了人类认知的很大一部分,为许多认知过程提供了合理的解释,被认为有可能作为理解心智如何运作的工具。同时,LIDA框架被认为可能对通用人工智能(AGI)的实现具有重要的帮助[17,18]。除此之外,Blum等人还基于GWT构建了意识图灵机(ConsciousTuringMachine,CTM,图1.12),认为可以用于构建具有意识的人工智能系统。

0a9b0275edf00f6989c85def333e0774.png

9f98ea0dd518f35dac31ce9f1779427b.png

互联互通社区

互联互通社区-IT智库,是互联互通社区IT架构、前沿技术平台。包含科技趋势、总体架构、产业架构、技术架构、系统架构、业务架构等内容,内容简练,皆属干货,合作请+微信:hulianhutongshequ.

4185f4933a0966a4fe1ca7e9631cc868.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/454419
推荐阅读
相关标签
  

闽ICP备14008679号