设计和评估医学深度学习系统

设计和评估医学深度学习系统
设计癌症诊断的深度学习研究。来源:奥斯陆大学医院

深度学习研究的更好设计能否加快医疗实践的转变?根据《设计癌症诊断中的深度学习研究》的作者发表在自然评论癌症在最近的一期杂志中,答案是肯定的。

“我们提出了几项协议项目,应该在评估外部队列之前定义”在奥斯陆大学医院癌症诊断和信息学研究所第一次作者Andreas Kleppe。“

“通过这种方式,评估变得严格且更可靠。此类评估将使哪些系统可能井井有力这些系统应该在III期随机临床试验中进一步评估。”

慢速实施是评估和适应影响患者治疗的系统所需的时间的自然后果。然而,许多评估功能良好系统的研究具有很高的偏见风险。

根据Kleppe的说法,即使在评估外部队列的看似最佳研究中,很少预定义的主要分析。适应的适应性系统,患者选择或分析方法可以使结果呈现过度乐观。

频繁缺乏对外部数据的严格评估特别关注。有些系统是为预期医疗环境的过度窄或不当数据进行开发或评估。在适当评估的医疗系统中缺乏将有希望的原型转换为适当评估的原型的评估步骤缺乏良好的评估步骤限制了深度学习系统的医学利用。

数百万可调参数

深度学习通过直接学习原始输入数据和目标输出之间的相关性,提供了可以在高维输入数据中使用复杂结构来模拟与目标输出的复杂结构的系统来利用大数据集。虽然监控机器学习技术传统上利用了仔细选择输入数据的表示,以预测目标输出,现代深度学习技术使用高度灵活的人工神经网络,将输入数据与目标输出直接相关联。

这种直接相关的关系通常是真实的,但有时可能是用于学习的数据的虚假现象。数百万可调参数即使在随机生成目标输出,也能够在训练集中正确执行,因此,完全毫无意义。

设计和评估挑战

神经网络的高容量给设计和开发深度学习系统以及在预期的医疗环境中验证其性能带来了严峻的挑战。只有当系统对不包括在训练数据中的受试者具有良好的通用性时,才可能有足够的临床表现。

设计的挑战包括选择适当的训练数据,例如目标人群的代表性。它还包括建模问题,例如如何在不损害训练数据中输入数据和目标输出之间的关系的情况下人为地增加训练数据的变化。

验证挑战包括验证系统的通用性。例如,当在新的地点对相关患者群体进行评估时,当使用不同的实验室程序或替代设备获得输入数据时,它是否能够令人满意地执行?此外,深度学习系统通常是迭代开发的,通过重复测试和各种可能导致结果偏差的选择过程。多年来,类似的选择问题已被公认为医学文献的普遍关注。

因此,在选择诊断性深度学习系统的设计和验证过程时,应该关注于泛化挑战,防止数据分析中出现更多的经典陷阱。

“为了使新患者取得良好的表现,使用各种训练数据是至关重要的。自然变异总是必不可少的,但引入人工变异也是必不可少的。这些类型的变异相互补充,促进了良好的归纳性,”Kleppe说。


进一步探索

在急诊科深度学习

更多信息:Andreas Kleppe等人。设计癌症诊断的深度学习研究,自然评论癌症(2021)。DOI:10.1038 / S41568-020-00327-9
期刊信息: 自然评论癌症

由奥斯陆大学医院提供
引用:设计和评估医学深度学习系统(2021年2月5日
此文件受版权保护。除作私人学习或研究之公平交易外,未经书面许可,任何部分不得转载。本内容仅供参考之用。
34股票

反馈到编辑

用户评论