新的机器学习方法允许医院私下共享患者数据
为了回答可以应用于广泛患者群体的医疗问题,机器学习模型依赖于来自各种机构的大型、多样化的数据集。然而,由于法律、隐私和文化方面的挑战,卫生系统和医院往往拒绝共享患者数据。
根据周二发表在该杂志上的一项研究,一种叫做联合学习的新兴技术可以解决这种困境科学报告该研究由宾夕法尼亚大学佩雷尔曼医学院放射学、病理学和实验室医学讲师、资深作者Spyridon Bakas博士领导。
联合学习(谷歌首先为键盘的自动更正功能实现的一种方法)跨多个分散设备或服务器训练算法,这些设备或服务器持有本地数据样本,而不交换它们。虽然这种方法有可能被用来回答许多不同的医学问题,但宾夕法尼亚大学医学院的研究人员已经证明,联合学习尤其在大脑成像的背景下是成功的,通过分析脑肿瘤患者的磁共振成像(MRI)扫描,区分健康脑组织和癌变区域。
例如,在宾夕法尼亚大学医学院(Penn Medicine)训练的一个模型可以被分发到世界各地的医院。医生可以在这个共享模型上进行训练,输入他们自己的病人大脑扫描图。然后,他们的新模型将被转移到一个中央服务器上。这些模型最终将被调和成一个共识模型,该模型从每个医院获得了知识,因此在临床上是有用的。
Bakas说:“计算模型看到的数据越多,它对问题的了解就越好,它就能更好地解决它设计用来回答的问题。”“传统上,机器学习使用的是来自单一机构的数据,然后很明显,这些模型不能很好地执行或推广来自其他机构的数据。”
联合学习模型需要经过美国食品和药物管理局的验证和批准,才能作为医生的临床工具获得许可和商业化。但如果该模型商业化,它将帮助放射科医生、放射肿瘤学家和神经外科医生对病人的护理做出重要决定,Bakas说。据美国脑瘤协会称,今年将有近8万人被诊断出患有脑瘤。
他说:“研究表明,当涉及到肿瘤边界时,不仅不同的医生会有不同的意见,而且同一名医生在进行同一次扫描时,在一周的某一天和下一天看到的肿瘤边界定义也会不同。”“人工智能可以让医生对肿瘤的末端有更精确的信息,这直接影响患者的治疗和预后。”
为了测试联邦学习的有效性并将其与其他机器学习方法进行比较,Bakas与来自德克萨斯大学MD Anderson癌症中心、华盛顿大学和匹兹堡大学Hillman癌症中心的研究人员进行了合作,同时英特尔公司为该项目提供了隐私保护软件。
这项研究从一个模型开始,该模型预先训练了来自一个名为“国际脑瘤分割”(BraTS)的开源存储库的多机构数据。BraTS目前提供了一个数据集,其中包括660名患者用磁共振成像(MRI)捕获的2600多张大脑扫描图。接下来,10家医院通过训练AI模型来参与研究患者数据.然后使用联合学习技术聚合数据并创建共识模型。
研究人员将联合学习与单一机构训练的模型以及其他协作学习方法进行了比较。每种方法的有效性都是通过与神经学家手动注释的扫描结果进行对比来衡量的。与使用不保护患者隐私的集中数据训练的模型相比,联邦学习的表现几乎(99%)相同。研究结果还表明,通过数据私人、多机构合作增加对数据的访问可以促进模型的绩效。
这项研究的发现为宾夕法尼亚医学院、英特尔和30个合作机构之间更大的、雄心勃勃的合作铺平了道路,该合作得到了美国国立卫生研究院下属的国家癌症研究所今年早些时候授予Bakas的120万美元的资助。英特尔在5月份宣布,Bakas将领导这个项目,在这个项目中,来自9个国家的30家机构将使用联邦学习方法来训练一个共识AI模型脑瘤数据。该项目的最终目标是创建一个开源工具,供任何医院的任何临床医生使用。宾夕法尼亚大学生物医学图像计算与分析中心(CBICA)的该工具的开发由高级软件开发人员Sarthak Pati, MS领导。
该研究的合著者、匹兹堡大学医学院放射学副教授Rivka Colen医学博士说,这篇论文和更大的联邦学习项目为人工智能在医疗保健领域的更多应用开辟了可能性。
“我认为这是一个巨大的游戏规则改变者,”科伦说。“放射组学之于放射学,就像基因组学之于病理学。人工智能将彻底改变这个领域,因为,现在,作为一名放射科医生,我们所做的大部分工作都是描述性的。通过深度学习,我们能够提取隐藏在这层数字化图像中的信息。”