联邦机器学习实现了迄今为止最大的脑肿瘤研究,而无需共享患者数据

大脑扫描
来源:Unsplash/CC0 Public Domain

宾夕法尼亚大学医学院(Penn Medicine)和英特尔公司(Intel Corporation)的研究人员领导了迄今为止规模最大的全球机器学习项目,安全地汇总了全球71个地点6314名胶质母细胞瘤(GBM)患者的脑部扫描数据,并开发了一种模型,可以在不损害患者隐私的情况下增强对三个肿瘤子区边界的识别和预测。他们的研究结果今天发表在自然通讯

宾夕法尼亚大学佩雷尔曼医学院病理学、实验室医学和放射学助理教授、资深作者Spyridon Bakas博士说:“这是文献中考虑过的最大、最多样化的胶质母细胞瘤患者数据集,这是通过联合学习实现的。”“我们为机器学习模型提供的数据越多,它们就越准确,这反过来又可以提高我们更精确地理解、治疗和移除患者胶质母细胞瘤的能力。”

研究罕见疾病的研究人员,如GBM(一种侵袭性脑肿瘤),通常将患者群体限制在自己的机构或地理位置。由于隐私保护立法的存在,例如美国1996年的《健康保险流通与责任法案》(HIPAA)和欧洲的《通用数据保护条例》(GDPR),因此跨机构的数据共享协作不会受到影响数据是许多医疗保健提供者面临的主要障碍。

一种新的机器学习方法,称为联邦学习,通过将机器学习算法引入数据,而不是遵循当前将数据集中到算法中的范式,为这些障碍提供了解决方案。联邦学习——一种首先由b谷歌实现的用于键盘自动校正功能的方法——跨多个分散的设备或服务器(在本例中是机构)训练机器学习算法,这些设备或服务器持有本地数据样本,而不需要实际交换它们。它一直是以前所示允许不同国家机构的临床医生在不共享任何私人患者数据的情况下进行研究合作。

Bakas和第一作者Sarthak Pati(宾夕法尼亚大学生物医学图像计算与分析中心的高级软件开发人员)、Ujjwal Baid博士(生物医学图像计算与分析中心的博士后研究员)、Brandon Edwards博士(英特尔实验室的研究科学家)以及Micah Sheller一起领导了这项大规模的合作研究。

“数据有助于推动发现,特别是在可用数据稀缺的罕见癌症中。凯斯西储大学医学院副教授Jill Barnholtz-Sloan博士说:“我们概述的联合方法允许访问最大的数据,同时降低数据共享的机构负担。”

采取了分阶段的方法。第一阶段,称为a公开初始模型使用公共数据进行预先训练国际脑肿瘤分割挑战赛。该模型的任务是确定三个GBM肿瘤亚室的边界:“增强肿瘤”(ET),代表肿瘤内血管血脑屏障的破坏;“肿瘤核心”(TC),包括ET和杀死组织的部分,代表与外科医生切除肿瘤相关的肿瘤部分;以及“全肿瘤”(WT),由TC和浸润组织的结合来定义,这是整个需要放射治疗的区域。

这首先是来自16个站点的231例患者病例的数据,并根据每个站点的本地数据对所得模型进行验证。第二阶段,叫做初步共识模型,使用公共初始模型,并纳入了来自35个地点的2471例患者病例的更多数据,从而提高了其准确性。最后阶段,或者最终共识模型使用更新后的模型,并整合了来自6大洲71个站点的6314例患者病例(3914680张图像)的最大量数据,以进一步优化和测试未见数据的可泛化性。

作为每个步骤的控制,研究人员从模型训练过程中排除了每个参与站点贡献的总案例的20%,并用作“本地验证数据”。这使他们能够衡量合作方法的准确性。为了进一步评估模型的泛化性,六个站点没有参与任何训练阶段,以代表完全看不见的“样本外”数据群体,共590例。值得注意的是,美国放射学院的网站使用一项全国性临床试验研究的数据验证了他们的模型。

在模型训练之后,最终的共识模型针对合作者的局部验证获得了显著的性能改进。最终的共识模型在检测ET边界方面提高了27%,在检测TC边界方面提高了33%,在检测WT边界方面提高了16%。改进后的结果清楚地表明,通过访问更多的案例,不仅可以改进模型,还可以验证模型,从而带来好处。

展望未来,作者希望由于联合学习的通用方法,它在医学研究中的应用可以是深远的,不仅适用于其他癌症,也适用于其他疾病,如神经变性,甚至更多。bob88体育平台登录他们还期待更多的研究来证明联合学习可以遵守世界各地的安全和隐私协议。

更多信息:联邦学习为罕见的癌症边界检测提供了大数据,自然通讯(2022)。DOI: 10.1038 / s41467 - 022 - 33407 - 5
期刊信息: 自然通讯

引用:联邦机器学习实现了迄今为止最大的脑肿瘤研究,而无需共享2023年1月12日从//www.pyrotek-europe.com/news/2022-12-federated-machine-enables-largest-brain.html检索的患者数据(2022年12月5日)
本文档受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。

进一步探索

新的机器学习方法允许医院私下共享患者数据

113股票

给编辑的反馈