预测模型识别患者进行基因检测

预测模型识别患者进行基因检测
(从左至右)道格拉斯·鲁德弗博士和西奥多·莫利在范德比尔特大学医学中心合影留念。图片来源:Donn Jones/范德比尔特大学医学中心。

一个研究小组今天在杂志上报告说,那些可能不为他们的医疗服务提供者所知,需要对罕见的未诊断疾病进行基因检测的患者,可以根据电子健康记录(EHRs)中的常规信息集体识别出来自然医学

范德比尔特大学医学中心的研究结果表明,在任何大型医疗保健系统的患者中,都有数百或数千人患有未确诊的罕见疾病可能会诊断出来。

“患有罕见遗传病的患者在进行基因检测之前通常要经历数年的漫长诊断过程,即使他们真的进行了基因检测。我们的工作有助于更系统和及时的方法,提醒可能从基因检测中受益的患者的提供者,”该研究的领导者、遗传学家道格拉斯·鲁德弗博士说,他是VUMC的医学副教授。

据估计,70%以上的罕见病是由遗传引起的。根据这项研究的作者,罕见的遗传疾病可能在每个病人身上都有很大的不同,即使在医学文献中有很好的描述,也可能没有被诊断出来。

目前,使用常规的电子病历数据直接识别患有特定遗传疾病的患者是相当具有挑战性的:根据该研究的作者,目前对致病原因的知识状态是不够的,而且目前临床检测的遗传分辨率太低。在这种情况下,研究团队开发了他们的预测模型,以检测在临床医生眼中符合测试历史标准的患者。

首先,该团队开发了一系列相互竞争的预测算法。为在美国,他们使用了临床医生要求进行一种名为染色体微阵列(染色体微阵列)的基因检测的患者的电子病历(1818例),以及记录显示没有基因检测史的类似患者的电子病历(7326例对照)。在训练和测试集中,患者的平均年龄为8岁。

“我们真正的目标是建立一个模型,捕捉并自动化对遗传疾病的临床怀疑,”与鲁德弗密切合作的数据科学家西奥多·莫雷(Theodore Morley)说。

带着所有从2286个记录的测试集中移除,一个机器学习算法表现最好,正确地分类了87%的案例和96%的对照。

波士顿马萨诸塞州总医院和VUMC的独立验证工作也显示出很高的准确性,这些医院的长期患者数量要多得多,病例现在由EHR中与遗传学提供者互动的证据定义。

重要的是,该算法在识别接受基因检测而非染色体微阵列检测的患者方面也表现良好。

这项研究支持这样一个假设,即在任何EHR人群中,被怀疑患有由于存在多种罕见的体征和症状(用研究的语言来说就是表现型),可以通过计算进行区分,这些体征和症状在EHR中有文档记录。该团队的预测算法专门使用EHR诊断代码(驱动医疗保健账单的相同代码),为了预测目的合并为所谓的表型代码。

Ruderfer说:“在广泛的验证证明了高预测性能后,我们非常感兴趣的是评估我们的模型的实现如何与当前接受测试的人的现状进行比较,以及这些测试的结果是什么。”

从Vanderbilt的DNA生物库BioVU的6,445个基因型患者标本中,该算法被证明能够准确地挑选出具有致病拷贝数变异(一种遗传异常)的个体。

在整理这项研究和其他研究结果时,作者估计在VUMC有超过2000名患者有一种未被识别的、潜在的诊断性拷贝数变异,可以通过基因测试识别。

这项研究的密切观察者包括医学博士、公共卫生硕士、VUMC精确医学中心主任乔希·彼得森(Ruderfer是该中心的附属教员)。

“球队的被证明轻松地超越了当前的临床表现,识别他们需要更快速和更多的检测。至关重要的是,该模型也被证明可移植到另一个卫生系统。这篇论文的发现与VUMC推动使用数据科学改善基因组综合征的诊断非常一致,”Peterson说。


进一步探索

假设的情况表明,基因检测在预测健康患者的疾病方面有显著的局限性

更多信息:临床数据中的表型特征使得系统识别患者进行基因检测,自然医学(2021)。DOI: 10.1038 / s41591 - 021 - 01356 - zwww.nature.com/articles/s41591 - 021 - 01356 - z
期刊信息: 自然医学

引用:预测模型识别用于基因检测的患者(2021年6月3日),2021年6月11日从//www.pyrotek-europe.com/news/2021-06-patients-genetic.html检索
本文件受版权保护。除用于个人学习或研究的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。
11股票

反馈给编辑

用户评论