在机器人辅助手术中,人工智能的合成数据优于真实数据
虽然人工智能继续改变着医疗保健,但这项技术也有一个致命弱点:训练人工智能系统执行特定任务需要大量带注释的数据,而工程师有时没有或无法获得这些数据。在一个完美的世界里,研究人员将能够在他们需要的时候以数字方式生成他们需要的确切数据,从而释放人工智能的新功能。
然而,在现实中,即使是用数字方式生成这些数据也很棘手,因为现实世界的数据,尤其是在医学领域,是复杂和多方面的。但解决方案正在酝酿之中。怀廷工程学院计算传感与机器人实验室的研究人员开发了一款软件,可以逼真地模拟开发人工智能算法所需的数据,这些算法在外科手术中执行重要任务,如x射线图像分析。
这项研究发表于3月20日自然机器智能他们发现,在多个应用中,用这个名为SyntheX的新系统构建的算法可以表现得和用真实数据构建的算法一样好,甚至更好,包括赋予机器人探测能力手术器械在程序。
“我们表明,生成真实的合成数据是一种可行的开发资源人工智能该论文的高级作者、计算机科学助理教授马蒂亚斯·昂伯拉斯说:“这些模型比收集真实的临床数据要可行得多,而真实的临床数据很难获得,在某些情况下,根本不存在。”
以x射线引导手术为例。假设你想要开发一种新的手术机器人和相关算法,使其能够在手术过程中将器械放置在正确的位置。只有一个问题:所需的训练数据集——在这种情况下,高度特定的x射线图像——不存在。
答案吗?研究人员说,通过模拟生成所需的数据。在研究中,该团队开始模拟x射线图像,这些图像将反映真实患者接受机器人辅助手术时拍摄的图像。为了做到这一点,研究人员利用了复杂的计算机模拟的力量,类似于流行的模拟视频游戏《模拟人生》或《我的世界》。
为了准确评估基于模拟的人工智能算法与基于真实数据的算法相比有多好,研究人员进行了一项史无前例的研究,他们在现实和仿真平台上创建了相同的x射线图像数据集。
首先,他们进行了一系列真正的x光和CT扫描,这些扫描都是通过手术c臂x光系统从尸体上获得的。接下来,他们生成了“合成”x射线图像,精确地再现了真实世界的实验。然后,真实和模拟数据集都被用于开发和训练新的人工智能算法,这些算法能够对真实x射线图像进行有临床意义的预测:髋关节成像分析、机器人手术器械检测和COVID诊断。当一切都说了,做了,研究小组发现,在模拟数据上训练的算法表现得和模拟数据一样好算法用真实数据训练。
Unberath说:“传统上,在合成数据上训练的模型在真实的临床数据上效果不佳,但SyntheX并非如此。”“我们证明,只使用模拟x射线训练的模型可以应用于诊所的真实x射线,而不会有任何性能损失。”
该团队说,该系统似乎是第一个证明现实模拟对开发x射线图像分析模型既方便又有价值的系统之一,这为各种新型算法铺平了道路。
“健康数据,尤其是手术数据,是一个挑战,合成数据可以产生巨大的影响。与获取真实的患者数据相比,生成大规模的模拟数据更灵活、高效、更便宜,并且可以避免隐私问题第一作者高聪补充道,他曾是昂伯拉斯实验室的研究生,现在是Intuitive Surgical的图像算法工程师。
该团队计划使SyntheX成为数据模拟的开源工具,这样其他研究人员就可以获得他们需要的数据集。
“如果你需要来自尸体或诊所的真实数据,世界上只有很少几所大学能做这项研究。我们的系统允许研究人员仅使用模拟以及模拟数据,这意味着更多的人可以在这个领域做出有意义的贡献和创新,”Unberath说道。
更多信息:高聪,合成数据加速了x射线图像分析的可推广学习算法的发展,自然机器智能(2023)。DOI: 10.1038 / s42256 - 023 - 00629 - 1.www.nature.com/articles/s42256 - 023 - 00629 - 1