打破刻板印象:大脑模型不是一刀切的
机器学习帮助科学家了解大脑是如何产生复杂的人类特征的,揭示了与工作记忆等行为、冲动等特征以及抑郁症等疾病相关的大脑活动模式。有了这些工具,科学家们可以创建这些关系的模型,然后在理论上,可以用来预测个人的行为和健康。
但这只有在模型代表所有人的情况下才会起作用,而之前的研究表明并非如此;对于任何模型来说,总有一些人是模型不适合的。
8月24日发表的一项研究自然在美国,耶鲁大学的研究人员研究了这些模型往往会失败的人,为什么会发生这种情况,以及可以对此做些什么。
医学博士阿比盖尔·格林(Abigail Greene)说,要使模型发挥最大的作用,它们需要适用于任何特定的个体。他是耶鲁大学医学院的学生,也是这项研究的主要作者。
“如果我们想把这种工作转移到一个临床应用例如,我们需要确保这个模型适用于坐在我们面前的病人,”她说。
Greene和她的同事们对模型如何提供更精确的精神病学特征感兴趣,他们认为这可以通过两种方式实现。第一种方法是更好地对患者群体进行分类。例如,精神分裂症的诊断包含一系列症状,而且因人而异。更深入地了解精神分裂症的神经基础,包括其症状和亚类别,可以让研究人员以更微妙的方式对患者进行分组。
其次,冲动等特征在各种诊断中都有。了解冲动的神经基础可以帮助临床医生更有效地针对这种症状,而不管它与什么疾病有关。
格林说:“这两项进步都将对治疗反应产生影响。”“我们越能更好地了解这些可能患有或不患有相同诊断的人,我们就能更好地为他们量身定制治疗方案。”
但她说,首先,模型需要适用于所有人。
为了理解模型失败,Greene和她的同事们首先训练了可以使用模式的模型大脑预测一个人在各种认知测试中得分的活动。经过测试,这些模型正确地预测了大多数人的得分。但对于一些人来说,他们是不正确的,错误地预测人们会得很差,而实际上他们得得很好,反之亦然。
然后,研究小组研究了模型未能正确分类的人。
“我们发现存在一致性——在不同的任务和分析中,相同的个体被错误分类,”Greene说。“在一个数据集中被错误分类的人与在另一个数据集中被错误分类的人有一些共同之处。所以被错误分类确实是有意义的。”
接下来,他们研究了这些类似的错误分类是否可以用这些人大脑的差异来解释。但是没有一致的差异。相反,他们发现错误分类与年龄和教育等社会人口因素以及症状严重程度等临床因素有关。
最终,他们得出结论,这些模型不仅仅反映了认知能力。相反,它们反映了更复杂的“概况”——某种认知能力和各种社会人口统计学和临床因素的混凝,Greene解释道。
她说:“这些模型让任何不符合这种刻板印象的人都失望了。”
例如,研究中使用的模型将更多的教育与更高的认知测试分数联系起来。任何受教育程度较低但得分较高的人都不符合模型的特征,因此经常被错误地预测为低分者。
使问题更加复杂的是,该模型无法获得社会人口学信息。
格林解释说:“社会人口学变量嵌入在认知测试分数中。”从本质上讲,认知测试的设计、执行、评分和解释方式的偏差会渗透到所获得的结果中。偏见在其他领域也是一个问题;例如,研究揭示了输入数据偏见如何影响刑事司法和医疗保健中使用的模型。
格林说:“因此,考试成绩本身是认知能力和其他因素的综合,而这个模型预测的是综合结果。”这意味着研究人员需要更仔细地思考一个给定的测试真正要测量的是什么,因此,一个模型预测的是什么。
该研究的作者就如何缓解这一问题提出了几项建议。他们建议,在研究设计阶段,科学家应该采用尽量减少偏见的策略,并最大限度地提高他们所使用的测量的有效性。在研究人员收集数据后,他们应该尽可能多地使用统计方法来纠正仍然存在的刻板印象。
研究人员说,采取这些措施将使模型更好地反映所研究的认知结构。但他们指出,完全消除偏差是不可能的,因此在解释模型输出时应该承认这一点。此外,对于某些度量,可能需要多个模型。
耶鲁大学医学院放射学和生物医学成像教授、该研究的资深作者托德·康斯特布尔(Todd Constable)说:“总有一天,你只需要为不同的人群使用不同的模型。”“一个模型并不适合所有人。”