习惯的形成是由经验调整的
大多数人都有习惯来指导他们的日常生活——例如,早上上班的路径,或者他们的就寝时间。驱动这种行为的大脑模式尚不清楚,但麻省理工学院麦戈文大脑研究所的一项新研究表明,习惯的形成似乎是一种天生的能力,可以通过经验进行微调——具体来说,某些选择的代价和回报。
由研究所教授Ann Graybiel领导的神经科学家们发现,未经训练的猴子在执行简单的视觉扫描任务时,会逐渐发展出有效的模式,使它们能够在最短的时间内获得奖励。
这项任务的设计是为了模拟自然场景——猴子可以做出几乎无限个选择,以及一个不可预测的奖励结构。“我们想要创造一个与我们每天行走的世界相似的环境——一个动物可以做出很多选择的环境,”麻省理工学院的研究生特蕾莎·德斯罗彻斯说,她是一篇论文的主要作者,该论文在《动物科学学报》上描述了这项工作美国国家科学院10月25日那一周。
这些发现不仅有助于揭示大脑格雷比尔说:“习惯的形成会形成习惯,但也可以揭示神经系统疾病,即放大的习惯形成会导致高度重复的行为,如图雷特综合症、强迫症和精神分裂症。”
强化学习
格雷比尔和德罗彻斯在他们的研究中采用了一种不同寻常的方法。在大多数对猴子的行为研究中,研究人员首先训练动物执行一项任务,然后开始实验。在这种情况下,格雷比尔和德斯罗彻斯想看看猴子是否能在没有任何训练的情况下学会一个简单的视觉自由扫描任务。
当猴子看着由4个或9个点组成的网格时,研究人员测量了它们的眼球运动和大脑活动。在每次试验中,在一段时间后,猴子只是环顾四周,然后随机选择一个不同的点作为“诱饵”,这意味着当猴子的目光落在那个点上时,它就成功了。试验成功后,猴子得到了食物奖励。
虽然这项任务本身很简单,但由于动物有大量的选择,它能够产生丰富多样的行为。
贝勒医学院(Baylor College of Medicine)的神经科学教授里德·蒙塔古(Read Montague)没有参与这项研究,他说:“在一些案例中,人们研究了大脑在非常简单的任务中做出连续决策的方式,但没有人研究过真正复杂的状态空间。”这意味着动物有近乎无限的选择。
这些猴子每天进行大约1000次这样的试验,几个月后,它们发现了一种越来越划算的方法来观察所有不同的点,这意味着它们能更快地到达目标点。
这些变化是渐进的:动物会使用一种模式5到10天,然后转换到一种略有不同的模式。研究人员在查看大量数据时,无法判断是什么导致了这些变化。然而,一项逐项的分析显示,扫描模式的微小变化可能会减少接收奖励的总体时间,这将加强猴子的行为,并导致猴子采用新的模式。
格雷比尔说:“结果是,成本的微小变化——他们移动眼睛的距离——似乎在推动这些转变,直到他们尽可能地做到最优,尽管事实上他们从未受到过指示。”
格雷比尔说,这表明灵长类动物“天生倾向于最大化回报,最小化成本”。她和Desrochers认为,这种被称为强化学习的现象也可能指导人类习惯的形成。
“当你开车去上班时,所花的时间永远不会完全相同。你可以尝试在不同的街道上避开红绿灯,或者其他一些微妙的变化。在某些时候,你可能会完全改变,”Desrochers说。
Desrochers和Graybiel计划设计研究,测试人类在眼部扫描任务中是否表现出与猴子学习的相同的习惯形成行为。他们还希望发现大脑的哪个部分控制习惯的形成。他们认为,在学习中起作用的基底神经节和参与计划的前额皮质可能是候选区域。
本文转载自麻省理工学院新闻(web.mit.edu/newsoffice/),这是一个很受欢迎的网站,涵盖有关麻省理工学院研究、创新和教学的新闻。
进一步探索
用户评论