深度学习识别癌症的分子模式
![Tumor samples are clustered into the four standard colorectal subtypes based on gene expression levels. The deep-learning maui platform classified the same samples similarly, but found that subtype 2 (represented in green in figure A) might actually be two separate types (represented in green and light blue in figure B). Credit: Akalin lab, MDC 深度学习识别癌症的分子模式](https://scx1.b-cdn.net/csz/news/800a/2019/24-deeplearning.jpg)
一种新的深度学习算法可以快速、准确地分析几种类型的结直肠肿瘤的基因组数据更准确的分类,这可能有助于提高诊断和相关的治疗方案,根据最新的研究发表在《华尔街日报》生命科学联盟。
结直肠肿瘤是非常不同的在如何发展,需要不同的药物和不同存活率。通常,他们分为亚型分析的基础上的基因表达水平。“疾病比只是一个基因复杂得多,”说Altuna Akalin,生物信息学的科学家领导的生物信息学平台研究小组MDC的柏林医学系统生物学研究所(BIMSB)。“欣赏的复杂性,我们必须使用一些机器学习真正利用所有数据”。
中包含的众多特性遗传物质,包括基因表达、单点突变和DNA拷贝数,Akalin和博士生乔纳森Ronen设计Multi-omics Autoencoder集成platform-MAUI短。
它是如何工作的
监督机器学习通常需要人类专家标签数据,然后训练一个算法来预测这些标签。例如,预测眼睛的颜色从眼睛的照片,研究人员首先喂算法与照片眼睛的颜色是标记。算法学习识别不同的眼睛颜色,能独立分析新数据。
相比之下,非监督机器学习不涉及培训。深度学习算法是没有标签和美联储数据筛选,找到共同的模式或代表的特性,称为潜在因素。例如,这种算法可以处理图片的面孔,不以任何方式标记,然后确定关键特性就像眼睛颜色,眉毛的形状,鼻子的形状和微笑。
深度学习平台,毛伊岛能够分析多个“组学”数据集和确定最相关的模式或特征,在这种情况下,基因集或结肠癌通路。
将子类型?
毛伊岛识别模式与结直肠癌的建立四个亚型,分配与高精度肿瘤亚型。它还发现了一个有趣的现象。这个平台找到一个模式,提出一个亚型(CMS2)可能需要分成两个独立的团体。肿瘤有不同的机制和存活率。团队建议进一步调查核实,如果肿瘤的亚型是独一无二的或者代表蔓延。不过,它展示了平台的能力采取的所有数据,而不是已知的与疾病相关的基因,并产生更深的见解。
“数据科学可以处理复杂的数据,很难处理其他方式和意义,“Akalin说。“你可以喂它所有你对肿瘤和它发现有意义的模式。”
![Ronen and Akalin discuss the research results. Credit: Felix Petermann, MDC 深度学习识别癌症的分子模式](https://scx1.b-cdn.net/csz/news/800a/2019/25-deeplearning.jpg)
更快,更好
程序不仅仅是更精确,它也比其他机器学习algorithms-three分钟运行更快挑选100模式与其他项目相比,这花了20分钟,11个小时。
“这是能够学习数量级更多潜在的因素,在计算时间的一小部分,”Jonathan Ronen说,这项研究的第一作者。
团队对系统执行速度感到惊讶,特别是因为他们没有利用gpu加速计算。这表明优化算法是非常好,尽管他们正在继续微调系统。
提高药物发现
该小组还包括拜耳公司计算生物学家兹亚是,适应他们的程序来分析细胞系从肿瘤,生长在实验室研究潜在的药物治疗的影响。然而,不同细胞系在分子水平上真正的肿瘤在许多方面。目前团队使用毛伊岛比较细胞株用于测试结直肠癌药物真正看到他们是多么密切相关的肿瘤。将近一半的行被发现比实际更相关的其他细胞系肿瘤。少数被发现是最好的线代表不同类型的CRC肿瘤。
在药物发现研究远离细胞系,这一观点可以帮助最大化细胞系研究的潜在影响,并可能适用于其他类型的药物会测试工具。
谷歌为肿瘤
现在结直肠癌的深度学习平台已经建立,它可以用来分析数据对新病人。
“觉得这像一个搜索引擎,”Akalin说。
临床医生可以输入新病人的遗传数据到毛伊岛找到最接近的匹配快速和准确地分类肿瘤。平台可以建议什么药已经用最接近的匹配肿瘤以及它们如何工作,从而帮助预测药物反应和生存前景。
就目前而言,这可能发生在一个研究设置只有在医生试图建立协议。这是一个漫长的道路测试或系统批准临床使用,Akalin说。团队正在探索潜在的商业化的帮助下,柏林卫生研究所的数字健康加速器项目。他们也在适应的过程中毛伊岛的其他类型的癌症。
更多信息:乔纳森Ronen et al。(2019):“评价结直肠癌亚型和细胞系使用深度学习”,生命科学联盟,DOI: 10.26508 / lsa.201900517