突变签名连接膀胱癌症和吸烟发现新的人工智能工具
圣地亚哥加利福尼亚大学的研究人员首次发现了一个模式的DNA突变将膀胱癌症与吸烟。这个发现是可能由于一个强大的团队开发的新的机器学习工具发现的突变模式引起的致癌物质和其他DNA-altering流程。
这项工作发表在9月23日细胞基因组学,可以帮助研究人员识别环境因素,如接触烟草烟雾和紫外线辐射,在某些病人致癌。
这些环境因素改变DNA以独特的方式,生成一个特定模式的突变,突变的签名。如果一个签名是在病人的DNA癌症细胞,癌症可以追溯到创建签名的接触。知道哪些突变签名礼物也可能导致更多的定制治疗病人的特定的癌症。
在这项研究中,研究人员发现的DNA突变的签名膀胱癌这是与吸烟有关。该发现具有重要意义,因为突变签名从吸烟中发现肺癌,但尚未在膀胱癌。
“有强大的流行病学证据系膀胱癌吸烟。我们甚至看到一个特定的突变签名在其他组织比如口腔,食道和肺部直接暴露于烟草致癌物”说研究高级作者Ludmil Alexandrov,生物工程和细胞和教授分子医学在加州大学圣地亚哥分校。“事实上,我们没有找到这个签名在膀胱很奇怪。”
Alexandrov和他的同事们现在显示有一个突变的签名在膀胱癌吸烟,和不同的签名肺癌。此外,他们还表明,该签名是发现在正常膀胱组织烟草吸烟者没有发达的膀胱癌。签名不是不吸烟者的膀胱组织中找到。
“这个签名告诉我们你的DNA中的某些基因突变是由于接触烟草烟雾研究co-first作者马科斯Diaz-Gay说:“Alexandrov的实验室的一位博士后研究员。“这并不意味着你有癌症。但是你吸烟越多,在你的细胞突变积累越多,你越增加你患癌症的风险。”
通过新一代机器学习
研究人员发现烟草签名与Alexandrov的实验室开发的新一代机器学习工具。该小组说,这是最先进,自动化的生物信息学工具提取突变信号直接从大量的基因数据。
“这是一个强大的机器学习的方法来识别模式的突变和基因组数据,区分“Alexandrov说。“这些模式,理解他们,这样我们可以看到突变签名和匹配他们的意思。”
他比较了机器学习方法在鸡尾酒会挑选个别谈话。
“你有多个组你周围的人们都在谈论,你只听到某些人说感兴趣,”他说。“基本上我们的工具可以帮助你做到这一点,但与癌症基因数据。有多个世界各地的人们接触不同的环境诱变剂,和那些暴露在其基因组留下痕迹。这个工具通过所有的数据来找出是什么导致突变的过程。”
该工具用于分析23827测序人类癌症。它发现四个突变signatures-including膀胱癌相关的一个吸烟——没有检测到任何其他工具。中的其他三个签名,胃、结肠和肝脏癌症,仍需要进一步研究,看看过程引起的。
展示了强大的工具,研究人员把它对13个现有的生物信息学工具测试。评估的工具的能力从超过80000合成提取突变签名癌症样本。Alexandrov的团队开发的工具已经超过所有其他人。它检测到20 - 50%更真实积极的签名,少了五次假阳性签名。它甚至在分析噪声数据表现良好,而其他工具失败了。
“在生物信息学,这是第一次这样一个全面的基准测试已经完成如此规模的突变特征提取、“Diaz-Gay说。“这是一个艰巨的任务,比较许多工具在许多数据集。”
创建一个更用户友好的和个性化的工具
团队的最终目标是创建一个基于web的工具,更多的研究人员可以使用,因此,更多的病人。
“现在,该工具需要生物信息学专业运行它,“Alexandrov说。”我们想要的是创建一个用户友好的网络版本,那里的研究人员可以减少患者的突变,并且立即给你的突变的签名和什么过程引起他们。”
“我们对未来的想法是利用这个工具来分析患者在个体层面上,“Diaz-Gay说。