研究人员使用机器学习证明DNA会影响癌症风险
生活方式 - 或者另一种方式,'坏习惯 - 是教科书解释之一,为什么有些人对癌症的风险较高。我们经常听到吸烟会使我们发育肺癌的风险或高脂饮食增加了我们培养肠癌的风险,但并非所有吸烟者都会患肺癌,并非所有吃芝士汉堡的人都能得到肠癌。“其他因素”必须在游戏中。
现在,卡尔加里大学的新研究德文王博士,博士,博士在那些“其他因素”上脱落。王已经发现了七个定义的DNA指纹或模式癌症风险。这项研究发表在科学推进。
“这个发现改写了教科书的说明,即由于人类行为而发生癌症,与一些不好的运气结合在一起,以包括一个人的遗传弥补,”王说。““我们认为,婴儿出生在种系基因组模式,它不会改变,并且这种模式与较低或更高的模式相关癌症风险。"
该研究提供了新的洞察力,因为种系代表了确定我们儿童和从父母传递给儿童的DNA的细胞。这是科学家们第一次描述了这些适用于癌症风险的高度专业化的生物模式。
王,癌症系统生物学家和大数据科学家,担任阿尔伯塔创新转化癌症基因组学主席。他假设每个人都符合这些风险类别,使他们或多或少容易患癌症,就像一个滑动量表。作为阿尔伯塔儿童医院研究所(ACHRI)和卡明医学院Arnie Charbonneau癌症研究所的成员,王发现DNA指纹可以分为不同的亚组,有不同的存活率。7种种系中有一种可以保护你不患癌症,而其他6种种患癌症的风险更大。
“有趣的是,这些种系中的一种对癌症有保护作用,而且它经常出现在我们的基因组分析中,”中科院生物化学与分子生物学系的王教授说。“我们知道有些人虽然吸烟,但生活方式不健康,却从未得癌症,这项发现或许可以解释这种现象。”
对于这项研究,王先生对一个巨大的个体种系基因组进行了大量的系统分析,约有10,000名患有癌症的人,休息。他的团队分析了计算机文件癌症患者这些样本包括22种不同的癌症,包括肺癌、胰腺癌、膀胱癌、乳腺癌、脑癌、胃癌、甲状腺癌和骨癌,以及其他十几种癌症。没有癌症的对照组包括来自瑞典、英国和加拿大的基因组测序组。
大量数据只能通过机器学习处理。王的实验室配备了通过Ucalgary的超高速网络处理数据。这项研究需要巨大的计算机存储量:1000万吨。为了帮助了解此卷,一个Terabyte可以存储250部电影。
“即使在高速下,有两条溪流运行24/7,我们的实验室三个连续几个月只是为了下载每种基因组中包含数十亿核苷酸的生物学信息,”王说。
王指出,在5%至10%的癌症之间是由特定基因突变引起的。思考乳腺癌和遗传基因BRCA1和BRCA2,Actor Angelina Jolie广泛闻名。王一直怀疑这些遗传癌只代表了一些协会,并对高级基因组能力进行了更深入的调查,以产生更多的协会。
“我们想研究基因组模式或基因组中大量重复出现的序列剖面是否可以作为癌症遗传易感性的一种有前途的测量方法,”王说。
“我们发现一个DNA指纹在癌症患者的种系基因组中富集了数百次以富集数百次,这表明它是一种普遍的可遗传性状,编码癌症风险。”该研究还发现,另一种DNA指纹在烟草吸烟者的癌症患者中,另一个DNA指纹富集,表明吸烟者患上这种DNA指纹具有更高的癌症风险。
基因组医学使疾病诊断更有效,成本效益,并且可以帮助人们在整个生命中做出健康决策。王的研究为患有癌症专家和家庭医生指导患者的工具奠定了基础。“我希望进一步研究进一步研究,以扩大这项工作,以便最终能够实施临床医生,允许患者通知患者的癌症风险以及如何采取预防措施以确保健康的生活。”
进一步探索
用户评论