新模型可以帮助识别突变致癌
肿瘤细胞可以有成千上万的在他们的DNA突变。然而,只有少数的实际推动癌症的进展;剩下的只是凑热闹而已。
区分这些有害的司机突变从中立的乘客可以帮助研究人员找出更好的药物靶点。为了促进这些努力,一个实地小组建立了一个新的计算机模型,可以快速扫描整个基因组癌症细胞和识别突变比预期的更频繁地出现,这表明他们是开车肿瘤的生长。这种类型的预测一直是具有挑战性的,因为一些基因组区域有极高的旅客突变频率,淹没了信号的实际司机
“我们创造了一个概率,深度学习方法,使我们能得到一个非常精确的模型数量的旅客突变基因组中应该存在,“麦克斯韦谢尔曼说,麻省理工学院的研究生。“然后我们可以看到整个基因组的地区有一个意想不到的积累的突变,这表明这些是驱动突变。”
在新的研究中,研究人员发现额外的整个基因组突变,导致肿瘤生长在5到10%的癌症患者。这一发现可以帮助医生确定药物,会有更大的机会成功治疗患者,研究人员说。目前,至少有30%的癌症患者没有检测到司机突变,可用于指导治疗。
谢尔曼,麻省理工学院研究生亚当Yaari,前麻省理工学院研究助理奥利弗Priebe是这项研究的主要作者,在今天自然生物技术。邦妮·伯杰,西蒙斯麻省理工学院的数学教授、计算和生物组织的计算机科学与人工智能实验室(权力),这项研究的资深作者,连同Po-Ru Loh,哈佛医学院助理教授和准会员的广泛的麻省理工学院和哈佛大学。Felix Dietlein,哈佛医学院的副教授和波士顿儿童医院,也是该论文的作者之一。
一个新工具
自从人类基因组测序二十年前,研究人员一直在基因组寻找突变导致癌症导致细胞生长失控或逃避免疫系统。这已成功取得了目标,如表皮生长因子受体(EGFR),通常在肺肿瘤突变,BRAF,黑色素瘤的一个共同的推动力。这两个突变现在可以特定药物的目标。
尽管这些目标已被证明有用,蛋白质编码基因只占约2%的基因组。另外的98%也包含突变可以发生在肿瘤细胞,但它已经很难找出如果这些突变导致癌症发展。
“真的是缺乏计算工具,允许我们寻找这些驱动突变蛋白质编码区域之外,”伯格说。“这是我们正在做的:设计计算方法不仅让我们看看基因组编码蛋白的2%,但是100%的。”
要做到这一点,研究人员训练的一种计算模型称为深层神经网络搜索癌症基因突变的发生比预期的更频繁。作为第一步,他们训练模型对基因组数据来自37个不同类型的癌症,这使得模型来确定背景为每个类型的变异率。
“我们的模型的真正好处在于你锻炼一次特定的癌症类型,它同时学习各地的突变率基因组特定类型的癌症,”谢尔曼说。“然后你就可以查询你看到的突变患者群体对突变的数量你应该期待看到。”
用来训练模型的数据来自于表观基因学项目和一个国际数据集合称为Pan-Cancer整个基因组的分析(PCAWG)。模型的分析,这些数据给研究人员预期的乘客突变率的地图在整个基因组,预期的速度在任何一组区域(到单碱基对)可以观察突变数相比在任何地方基因组。
改变景观
使用这个模型,麻省理工学院的团队能够添加到已知的景观可以推动癌症的突变。目前,当癌症患者肿瘤筛查致癌突变,一个已知的司机将三分之二的时间。麻省理工学院研究提供的新结果可能驱动突变池的一个额外的5 - 10%的病人。
一种非编码基因突变研究人员专注于被称为“神秘的拼接突变。”Most genes consist of sequences of exons, which encode protein-building instructions, and introns, which are spacer elements that usually get trimmed out of messenger RNA before it is translated into protein. Cryptic splice mutations are found in introns, where they can confuse the cellular machinery that splices them out. This results in introns being included when they shouldn't be.
使用他们的模型,研究人员发现,许多神秘的拼接突变出现破坏肿瘤抑制基因。这些突变存在时,肿瘤抑制拼接错误而停止工作,和细胞失去其防御癌症之一。神秘的接头地点的数量,研究者发现在这项研究中约占5%的司机突变中发现的肿瘤抑制基因。
针对这些突变可能提供一种新的治疗患者,研究人员说。一个可能的方法,仍在开发使用短链RNA的反义寡核苷酸(ASOs)修补一个突变的DNA与正确的序列。
“如果你能让突变消失在某种程度上,然后解决问题。这些肿瘤抑制基因可以继续操作,也许抗击癌症,”Yaari说。“麻生太郎技术正在积极开发,这可能是一个非常好的应用程序。”
另一个地区,研究者发现高浓度的非编码驱动突变的区域一些肿瘤抑制基因。肿瘤抑制基因TP53,缺陷在许多类型的癌症,已经积累很多删除这些序列,称为5 '非翻译区。麻省理工学院研究小组发现肿瘤抑制称为ELF3相同的模式。
研究人员还利用他们的模型调查是否已知的常见突变也可能推动不同类型的癌症。举个例子,研究人员发现,BRAF,以前与黑素瘤,也会导致癌症恶化在较小比例的其他类型的癌症,包括胰腺、肝脏和胃食管。
”说,其实有很多重叠常见的司机和景观的景观罕见的司机。为治疗再利用提供了机会,”谢尔曼说。“这些结果可能有助于指导临床试验,我们应该建立扩大这些药物从被批准癌症被批准在许多癌症和能够帮助更多的病人。”
进一步探索