本文来自微信公众号:nextquestion (ID:gh_2414d982daee),提问:Lixia,编辑:summer、EY,头图来自:视觉中国
我们在日常生活中,每时每刻都在做决策。从简单的晚餐吃什么,到复杂的与他人的互动,都有决策的身影。决策是认知和神经科学领域重要的一个研究方向,为了带大家深入了解决策及其背后的机制,我们将以决策研究领域的问题进行追问,以多人联动的方式,带领大家了解决策背后的原理以及目前的最新进展。
本次我们采访了北京大学心理与认知科学学院研究员朱露莎,朱露莎研究员将带领我们了解目标导向性决策的相关研究。
朱露莎
Q:您为什么会选择决策作为研究方向?
朱露莎:我主要研究人类决策意图、对环境对他人的推断,以及它们怎么影响决策的策略。比如,我们实验室常研究博弈行为,在人际交互中,我们经常需要判断对方的目的到底是什么(是合作共赢,还是骗一把就走),需要预测对方下一步的选择是什么,以及对方的选择会对我自己造成什么样短期和长期的影响。
这种种看不见摸不着的意图、推测和预判是人类智能中最高级最复杂的部分,也可能是人区别于其他物种的关键之处,更是人类各种重要的行为——比如合作、竞争、协作、交流——的智能基础。我们希望能够对这一部分智能有一个深入、定量、机制性的了解。这是一个认知科学的问题,一个博弈研究的问题,一个计算科学和神经生物学结合的问题,一个生物智能和人工智能结合的问题,一个自然科学和社会科学结合的问题,一个在我看来重要、有趣、多学科结合的问题。
我自己逐步在探索的过程中慢慢找到自己感兴趣的方向。我本科读的是物理,我喜欢物理学的研究方法,即将复杂的问题进行简化和抽象,通过定量的手段和建模的方法,刻画事物底层的关键规律,然后通过实验去证明和证伪。
读了几年后,我觉得做物理实验不太适合我,而且相比于自然界,我对人和社会更感兴趣。当时我觉得经济学是个跟物理学类似的学科,也用类似的建模手段探索复杂事物的底层规律,只不过研究对象不是自然界而是人的行为和社会活动。因此,我后头就转去做经济学的研究。
在博士期间,我一开始的研究方向是博弈理论,有点类似于应用数学的研究,解一些复杂条件下的最优策略和均衡。做了几年,我觉得这也不是我喜欢的东西,我慢慢感到,我自己真正感兴趣的问题是,人到底是怎么做决策的,而不是人应该怎么做研究(博弈论的传统研究问题)——事实上,人类的决策很多时候都会背离应该的、最优的策略。
我自己觉得真正有趣的是这些非最优策略是怎么产生的,底层的逻辑是什么?这些非最优策略是朝着一个方向产生系统性的、可预测的偏离,还是随机的、噪音性的分布?
当时,决策神经科学(或者叫神经经济学)这个新兴的交叉学科领域正处于快速发展阶段,研究者将多学科研究手段相结合,从底层神经生物学的角度探索决策机制。因为一些机缘巧合,我慢慢转向这个领域的研究,之后干脆就将研究方向转换到了决策神经科学。总的来说,我希望从一个机制性的角度来理解决策的智能基础,以及它们和一些社会性行为或社会现象之间的关系。这是我选这个领域的原因。
Q:您在做相关研究的过程中,用到了哪些方法和手段,可以跟我们分享一下吗?
朱露莎:我们的研究涉及多个学科的方法,比如社会学、经济学、语言学、计算机科学的一些方法,并把这些方法和认知神经科学中的一些手段,例如fMRI(功能性磁共振成像)、脑损伤、药物,或者一些神经操控手段相结合,以人为对象进行研究。
通俗一点来说,比如在博弈相关的研究里,我们用博弈游戏搭建人际交互的实验平台,用脑科学研究手段(如核磁共振、脑损伤、脑刺激等)来探查交互个体决策的硬件,用博弈论、机器学习、计算语言学等模型来刻画生成决策行为的软件,由此来理解决策行为的认知和神经机制,以及这些机制在神经和精神疾病下将会出现怎样的偏差。
Q:像您刚刚提到的,您的实验室以人为研究对象,关注的是大脑的决策过程。人是社会性生物,在社会活动过程中涉及竞争、合作与交流,在这些过程中,人是如何做决策的?
朱露莎:先澄清一下,决策包括很多种,可以是感知觉决策、运动决策等等,都会受到社会交互的影响,比如国内有的实验室会探索我们怎么判断远处两个人的社会关系,这可以是很有趣的感知觉决策问题。
但我们实验室关注的目标导向性决策(goal-directed decision making)——通俗地说,就是为了达成某种目的而做的决策,比如为了吃饱而觅食,为了利益最大化而和人合作。
具体到社会决策领域,目前主流的研究问题大约可以分成两块。一块是意图、动机、目的怎么影响社会决策。在社会环境中,我们的决策动机不像非社会环境中那么简单,我们不仅仅要考虑个体利益最大化,还需要考虑他人、群体的利益,考虑公序良俗、社会规范等等,有些社会动机可能在漫长的演化过程中已经被内生为我们奖赏系统的一部分来影响我们的行为。
因此这里有趣的问题是这些看不见摸不着的社会性动机是怎么被我们的奖赏系统表征、运算、和其他的利益相互权衡影响我们的行为选择的。其中一个挑战是,这些抽象的社会性动机和复杂的社会行为,怎么被抽象的数学模型严格地刻画,产生定量的行为和神经层面的预测。
另一块研究是对社会环境和交互对象的推断,例如我之前举的例子中,对他人下一步行为的预判。在非社会情境中,我们的大脑常常通过统计学习,来推断周边的环境。
但在交互式的社会决策中,这种统计学习会变得非常复杂,就像玩石头剪刀布一样,当我们推断对手的选择时,他也在推断我们的选择,因此我们常常需要推断对方关于我们的推断等等,这种高阶的递归的推断是怎么产生的,大脑采用了什么算法,大脑的算法有没有系统性偏差,存不存在智能的上界,以及这些推断和合作竞争等社会行为的关系是什么等等,这些都是目前很活跃、有趣的研究问题。
Q:提到交互,您实验室在Science Advances上发表了一篇非常有意思的文章,是关于如何理解交流对象的谈话内容,如何理解言外之意、弦外之音,可否跟我们分享一下这篇研究?
朱露莎:在这篇文章里,我们关心的主要问题是,大脑怎样针对特定的交流环境来使用交流信号,对交流信号进行解码。
举个例子来说,一个人问“你们学校老师讲课怎么样”,可能有个同学回答“有的老师课讲得还不错”。这时,你马上能领会到这句话的言外之意:“有的,但并不是全部老师讲课不错,换言之,这个同学想说,有的老师课讲得不怎么样”。这种言外之意的理解,跟使用什么语言无关,所有人都能够很快地、很正确地解码出言外之意。
这种交流就是一种博弈行为。 我们研究的问题是这种言外之意的解码到底是怎么进行的。我们的研究提出的一个主要的观点是,听话的人通过模拟说话的人对话语理性选择的过程,来理解言外之意。
在刚才这个例子里面,听话的人会想,如果说话人想说的是该学校全部老师课都讲得好,他应该会选择说“学校里老师讲课都很好”,之所以说有的老师,而不是全部老师讲课很好,大约是想暗示有些老师课讲得不好。换言之,解码交流信号的过程,可能包含了把自己放到说话人的立场上,模拟说话人在当下的语境中,怎样最有效地选择交流的信号,最优地表达自己想表达的意思。然后由这个过程反推出说话人到底想表达什么。
我们把认知神经科学、计算语言学、博弈论等方法结合起来,研究这个问题。我们发现,人类大脑通过灵活、自动、理性地模拟说话人理性的话语选择,来推断交流信号的潜在含义。这一过程可以在数学上描述为一个基于逆向推理的归因过程,该推理过程所需的几种关键的认知变量由腹内侧前额叶和纹状体的活动定量表征,为理解社会交流提供了一个简单、可扩充的认知神经模型。
有趣的是,在有些情况下,听众无需推理,可以由字面含义获知对方的意图,听众的腹内侧前额叶仍然稳定地表征了这模拟信号,意味着对交流伙伴行为的模拟也许是一个自动的神经加工过程。
Q:我们的日常交流有一来一往的面对面口头交流,也有书面文字交流。在不同交流过程中,大脑理解他人意图的方式,也就是解码的过程会有区别吗?
朱露莎:我们这个实验本身是用书面文字呈现的,虽然我目前并没有实验数据,但是我猜,我们发现的规律并不局限于书面文字,应该对包括声音、身体语言在内的多种交流信号都成立。当然,不同的情况会有一些特异性,比如不同于书面文字,口头交流时说话人说得比较快,产生错误的概率也许比书面交流高,因此听话人的生成模型的容错度会不太一样。
Q:您实验室还关注了道德判断的生物机制这方面的研究,对于人到底是性本善还是性本恶这样的争论由来已久,为什么人在社会生活过程中会受道德的约束?从进化上来说,人和动物之间的道德感在生物基础上是否有本质区别?
朱露莎:我们前些年的研究和这个有关,这个问题说起来可以讲整整一个学期的课了。简单讲一下我们相关的研究。人到底是性本善还是性本恶这样的争论,现代认知心理学家和道德哲学家们一直在认知控制机制的框架下讨论,也就是心理学中很有名的双系统——快系统(直觉,本能)和慢系统(认知控制后的反应)。
我们知道,前额叶背外侧皮层是实施认知控制的最重要脑区之一,一旦这一脑区受损,我们可能就不能进行认知控制,只剩下本能反应。如果人性本善假设成立,失去认知控制后,我们只剩下本能的道德;反之,人性本恶理论下,失去认知控制后,我们只剩下本能的自私。在这个逻辑下有一系列研究来探索人性本善或者人性本恶。
我们之前研究了两类大脑前额叶有损伤的病人,一类是前额叶背外侧皮层有损伤,另一类是眼眶额叶皮质有损伤,还有一组大脑没有受伤的人作为对照组。这些人参与了一个叫做“信号游戏”的实验,这个游戏在进化生物学、博弈论以及实验经济学中被广泛使用。
实验分两部分。第一部分实验中,参与者面临两个选项:要么自己获利更多,要么他人获利更多。毫无意外,大部分参与者选择自己获利更多的选项。第二部分实验中,参与者面临同样两个选项,但他们不能直接做出选择,而是需要向另一位参与者发送一条信息,告知哪个选项回报更多,说服其作出选择。如果说真话,发信人将获利较少;如果说假话,发信人将获利较多。
我们的研究表明,大脑没有受伤的人往往更愿意说真话。而前额叶背外侧皮层受损的人行为模式有所不同,一旦诚实与私利相矛盾,他们更多做出不诚实的抉择。这一结果说明前额叶背外侧皮层这一负责认知控制的重要脑区,也许是诚实行为的“开关”。换言之,这个结果支持了人性本自私的假说。
至于人和动物的道德感在生物基础上是否有本质区别,我觉得当然是有的。比如,人类会面临很多复杂的道德两难情境,需要复杂的权衡和推理,这些过程就和社会决策息息相关,涉及我前面说过的高等的社会奖赏的计算,对其他社会个体意图行为的预判等等,比如目前并没有特别充足的证据证明动物会有和人一样强大的心理理论(theory of mind)能力,所以动物的的道德权衡,即便有也大约会初级一些。
Q:您实验室同时关注健康和疾病人群的社会决策的认知过程,可否与我们分享这方面的进展?
朱露莎:在决策领域近年来一个特别大的发展是计算精神病学(computational psychiatry),把包含决策神经科学在内的一些领域的研究成果,应用到精神疾病相关领域的研究中,以期为这类疾病的定量诊断和发展个性化治疗手段提供一些新的思路。
最近几年来,我们一方面和合作者一起,利用像强化学习在内的一些手段,研究抑郁、成瘾和PTSD病人在决策上的特殊性。比如最近一个研究着眼于对抑郁症的认知行为疗法的研究,发现强化学习的行为模式和大脑激活模式可以跨越6年的时间长度,预测认知行为疗法对抑郁症的治疗效果。
另一方面,我们把我们的社会决策研究成果应用到儿童和青少年人群中,以及那些有自闭特质的青少年中。比如我们发现14~15岁对于理解言外之意的能力是个很特殊的发展阶段,以及自闭特质对于这一能力的发展可能有一些意想不到的影响。
Q:您实验室未来的研究重点是什么?
朱露莎:之前,我们利用统计学习的方法,来研究过往社会交互的经验怎么塑造我们的意图、推断和策略。然而,生物智能和人工智能领域中更有趣、也更有挑战性的问题是,面对新环境新对象,大脑/人工智能用什么算法来预测他人的行为?它和知识的迁移泛化有什么算法和执行层面的关联?它如何解释理性/有限理性的行为? 这个问题很重要,也很有趣,我们实验室长期招收博士后,特别欢迎在认知神经科学、机器学习、自然语言处理、博弈论和行为经济学等方面有相关专长的研究者加入。
本文来自微信公众号:nextquestion (ID:gh_2414d982daee),提问:Lixia,编辑:summer、EY