研究人员使用机器学习来解锁临床癌症样本中的基因组密码

研究人员使用机器学习来解锁临床癌症样本中的基因组密码
福尔马林暴露的突变特征。C>T ffpe突变数随着福尔马林固定时间的增加而增加。我们观察到研究1(固定组)中未修复和修复的ffpe样本均有此增加。仅FFPE突变是指仅在FFPE中发现而未在FF样本或已知生殖系数据库中发现的突变。柱状高度表示n = 3例患者的平均C>T计数,个体计数用黑点标记。b使用80通道光谱(non-T>C)对未修复的ffpe和修复的ffpe样品观察到一致且可分离的突变模式。我们使用t-SNE对来自研究1和研究2的归一化80通道突变谱(n = 110)进行聚类(参见方法)。c T> c突变未观察到一致和可分离的突变模式。我们使用T - sne将研究1和研究2的归一化T>C突变谱(n = 110)聚类。d我们推导的FFPE签名与已知COSMIC SBS签名的比较。 e, f Unrepaired signature is highly similar to SBS30 (e) and repaired signature is highly similar to SBS1 (f). We treated T>C features as missing data due to the strong batch-effect found in study 1, which is also observed in a few other studies shown in Supplementary Table 1 and therefore they were assigned to zeros. We noted that zero values are approximately close to the true T>C mutation probabilities in FFPE datasets without this batch-effect (Supplementary Fig. 6f). Error bars indicate the standard deviation in n = 55 independent samples with top 50% density in t-SNE cluster (see Methods). g, h Large variability in T>C mutation channels. We derived the T>C patterns using the same methods applied in (e, f). The error bar showed the standard deviations in n = 55 independent samples with top 50% density within the t-SNE (see Methods). Credit:自然通讯(2022)。DOI: 10.1038 / s41467 - 022 - 32041 - 5

赫尔辛基大学的一篇新论文今天发表在自然通讯,提出了一种准确分析癌症档案活检中基因组数据的方法。该工具使用机器学习方法来纠正受损的DNA,并揭示肿瘤样本中的真实突变过程。这有助于在数百万个档案癌症样本中解锁巨大的药物价值。

基于分子的诊断有助于将合适的患者与合适的患者相匹配治疗。研究人员对临床癌症样本中的DNA分析特别感兴趣。

“由于DNA质量差,这种宝贵的来源目前没有用于分子诊断。福尔马林会对dna造成严重损伤,因此对分析提出了不可避免的挑战来自赫尔辛基大学的主要作者郭庆利说。

分析癌症基因组的突变过程可以帮助早期癌症检测,准确诊断癌症,并揭示为什么一些癌症对治疗产生耐药性。这种新方法可以极大地加速临床应用的发展,从而直接影响未来的癌症

这种新方法预测了90%以上的癌症发展过程

主要作者Qingli Guo与伦敦癌症研究所(ICR)和伦敦玛丽女王大学的科学家密切合作,开发了名为FFPEsig的机器学习方法,以揭示福尔马林是如何突变DNA的。

“我们的研究结果表明,通常情况下,如果没有噪声校正,近一半的癌症过程将被忽略。然而,使用FFPEsig, 90%以上的预测是准确的,”Qingli说。

癌症是逐渐演变的。分析纵向样本中的突变过程有助于确定临床信息性预测因子,并对每个肿瘤分期进行诊断。

“我们的发现能够从保存在室温下数十年的肿瘤活检中表征临床相关特征。随着对福尔马林如何影响癌症基因组的深入了解,我们的研究为利用大量具有成本效益的档案样本改造开发的特征检测分析提供了巨大的机会,”研究人员说。

研究人员指出,目前该方法还不能完全去除FFPE样本中出现的显示批量效应的伪影,而且该工具的表现因癌症类型而异,因此必须小心解释任何发现。他们也有兴趣在未来将他们的方法进一步应用到更广泛的档案样本中。

更多信息:郭庆利等,福尔马林固定对人类基因组的突变特征,自然通讯(2022)。DOI: 10.1038 / s41467 - 022 - 32041 - 5
期刊信息: 自然通讯

所提供的赫尔辛基大学
引用:研究人员使用机器学习解锁临床癌症样本中的基因组代码(2022年9月6日),检索自2022年12月17日//www.pyrotek-europe.com/news/2022-09-machine-genomic-code-clinical-cancer.html
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。

进一步探索

研究证明了使用基于血液的液体活检与肺癌组织活检的协同作用

48股票

对编辑的反馈