netflix风格的算法构建癌症基因组蓝图
英国癌症研究中心和癌症大挑战基金会资助的科学家们表示,你观看Netflix的习惯背后的科学原理可能很快就会用于指导医生治疗癌症。
一个国际科学家团队使用了人工智能(AI)来研究和分类基因组中DNA变化的大小和规模——一个细胞的完整遗传密码——当癌症开始和生长时。
利用人工智能技术,科学家们已经确定了癌症开始和发展时存在的DNA拷贝的结构、顺序和数量上的21种常见缺陷。这些常见的错误被称为复制数签名,可以帮助指导医生进行反映肿瘤特征的治疗。
当你观看Netflix时,会产生关于你观看电影和电视剧类型的数据,你观看它们的频率,以及你是对它们“点赞”还是“不点赞”。Netflix使用算法来分析大量的数据,找到你观看内容的模式,然后在你浏览Netflix时推荐新的电影和电视剧。
由伦敦大学学院(UCL)的Nischalan Pillay博士和加州大学圣地亚哥分校(UC San Diego)的Ludmil Alexandrov博士领导的研究小组建立了一个类似的算法,可以筛选数千行基因组数据,并挑选出染色体如何组织和排列自己的共同模式。然后,该算法可以对出现的模式进行分类,并帮助科学家确定癌症可能发生的故障类型。
利用该算法,科学家们在9873名患有33种不同类型癌症的患者的全测序基因组中寻找模式。该算法确定了肿瘤中21种常见的染色体结构和数量缺陷,并将它们分类为不同的“类型”,称为拷贝数签名。
这21个拷贝数字签名现在将被用来创建一个蓝图,研究人员可以用它来评估癌症的侵略性,找到它的弱点,并设计新的治疗方法。
加州大学圣地亚哥分校副教授、该研究的联合主要作者Ludmil Alexandrov博士说:
“癌症是一种复杂的疾病,但我们已经证明,它发生时染色体的变化和它的生长方式有显著的相似之处。
“就像Netflix可以预测你接下来会选择疯狂观看哪些节目一样,我们相信,我们将能够根据癌症基因组之前经历的变化,预测你的癌症可能会如何表现。
“我们希望医生能够看到病人完全测序的肿瘤,并将肿瘤的关键特征与我们的基因组缺陷蓝图相匹配。有了这些信息,我们相信医生将来能够提供更好、更个性化的癌症治疗。”
科学家们之前研究了这些大规模的基因组错误是如何在肉瘤中发生的,并希望找到方法来研究不同类型癌症的这些变化。
该算法使用由亚历山德罗夫博士开发的名为SigProfilerExtractor的软件,利用复杂的数学运算来扫描癌症患者的测序数据,并识别出不同类型癌症中染色体重组的共同模式。
科学家们进一步研究了对癌症患者预后影响最大的复制数特征。在该算法识别的21个特征中,科学家们发现,染色体破裂和重组的肿瘤(称为嗜色症)与最差的生存结果相关。例如,该研究发现,患有恶性胶质瘤(一种侵袭性脑肿瘤)的患者,如果他们的肿瘤发生了嗜铬症,那么他们的生存结果就会更差。平均而言,没有发色症的胶质母细胞瘤患者比肿瘤有发色症的胶质母细胞瘤患者存活时间长6个月。
科学家们希望他们能够改进算法,使医生能够根据癌症开始时获得的遗传特征以及在生长过程中获得的遗传变化,找出癌症可能的表现。
该研究的联合主要作者、伦敦大学学院肉瘤和基因组学副教授Nischalan Pillay博士说:
“为了领先癌症一步,我们需要预测它是如何适应和变化的。
“突变是癌症的关键驱动因素,但我们的很多理解都集中在癌症中单个基因的变化上。我们一直没有看到更大的图景,即大量基因可以被复制、移动或删除,而不会对肿瘤造成灾难性的后果。
“了解这些事件是如何发生的将有助于我们重新获得对抗癌症的优势。多亏了基因组测序的进步,我们现在可以看到这些变化在不同类型的癌症中发挥作用,并找出如何有效地应对它们。”
科学家们已经将SigProfilerExtractor和其他研究中使用的软件工具免费提供给其他科学家,这样他们就可以根据从肿瘤测序中获得的数据,使用该算法从DNA中构建自己的netflix式染色体变化库。
伦敦大学学院博士后研究员、该研究的第一作者克里斯托弗·斯蒂尔博士补充道:
“我们相信,将这些强大的计算工具免费提供给其他科学家,将加速为患者制定个性化癌症蓝图的进程,为他们提供最佳的生存机会。”
英国癌症研究的首席执行官米歇尔·米切尔说:
“英国癌症研究中心在了解癌症背后的遗传学方面一直走在前列。当我们庆祝我们的20周年纪念日时,有一个惊人的消息,我们可以在多个方面建立一个蓝图肿瘤这些类型可能会帮助研究人员预测癌症的表现,并展示我们如何用更精确的治疗方法来解决它。
“这项研究是癌症大挑战的另一个辉煌成果,该项目旨在解决癌症研究中一些最大的挑战。”
这篇论文题为“人类复制数改变的签名”癌症,于今日出版自然.