一个新的机器学习工具国旗前危险的细菌可能导致爆发
一个新的机器学习工具能够检测是否新兴菌株的沙门氏菌更有可能引起危险的血液感染而不是食物中毒了。创造的工具,威康基金会桑格研究所的科学家和她的合作者在奥塔哥大学、新西兰和亥姆霍兹RNA-based感染研究所,一个网站的亥姆霍兹感染研究中心,德国,大大加速的过程识别潜在的新入侵类型的基因变化沙门氏菌的公共卫生问题。
报道,今天(5月8日)公共科学图书馆遗传学,机器学习工具可能是有用的危险的细菌导致爆发之前,从医院到全球范围。
随着基因组测序的成本下降,世界各地的科学家使用遗传学更好地理解引起感染的细菌,传播的疾病,细菌是如何获得抗药性,的菌株可能导致爆发。
然而,当前的方法来识别新兴的菌株的遗传适应性爆发的背后,是耗时的,通常涉及手工比较新菌株老参考集合。
细菌的群体被称为沙门氏菌包括许多不同类型,不同疾病的严重程度。某些类型引起食物中毒,称为肠胃沙门氏菌,而其他肠道蔓延导致严重疾病,例如沙门氏菌伤寒这导致伤寒。
了解确定一个新兴菌株的基因变化沙门氏菌血清会导致食物中毒和更严重的感染,研究人员建立了一个机器学习模型,分析突变发挥重要作用。
团队训练模型使用古老的血统沙门氏菌在进化上是截然不同的,包括6个沙门氏菌细菌侵入性感染引起,七胃肠道的菌株。机器学习模型确定了几乎200个基因参与确定细菌是否会引起食物中毒或更好的适应是一个侵入性感染。
妮可·惠勒博士威康桑格研究所的联合首席作者说:“我们设计了一种新的机器学习模型,可以确定哪些新兴的菌株可能是一个公共卫生问题。使用这个工具,我们可以处理大规模数据集,并在几秒内得到结果。最终,这项工作将产生重大影响的监测有害细菌的方式我们之前没能,不仅在医院病房,但在全球范围内。”
当应用于菌株沙门氏菌目前新兴在撒哈拉以南非洲,该工具从池中正确地强调了两种类型的一般循环感染(肠炎沙门氏菌和鼠伤寒沙门氏菌)更危险的血液,与更高的数字感染用例。
这些感染尤其糟糕的免疫系统较弱的人,如艾滋病。机器学习工具启用显示的基因变化沙门氏菌菌株适应宿主和更具侵入性。
Lars Barquist博士,该研究从德国亥姆霍兹RNA-based感染研究所说:“机器学习工具是一个推进与其他方法相比,因为它不仅搜索基因和突变,它看起来对功能影响突变在这些bug。最好可以告诉我们这突变使病原体在肠道和蔓延导致危及生命的疾病,而不是食物中毒。这将有助于在未来设计更有效的治疗。”
机器学习工具,基于随机森林模型产生侵袭性指数*,不仅限于沙门氏菌可以用来研究其他因素如新兴抗生素耐药性的细菌。它可用于实时识别危险的细菌扩散前就会爆发。
尼古拉斯博士Feasey利物浦热带医学学院的,说:“我们已经使用这种方法来寻找关键的差异伤寒沙门氏菌循环在亚洲与非洲。而不是手动比较不同的菌株的基因组在数周或数月,我们能够发现基因变化在新兴菌株的细菌在几秒钟内。它提供了潜力研究实时爆发,从而迅速通知公共卫生策略来控制或预防疾病。”
*随机森林工作通过建立决策树的整体设计预测样本的特征,在这种情况下背后的基因变化适应生存的细菌侵入性或非侵入性的环境(即居住在血液或肠道内)。
Breiman l .随机森林。马赫学习。Kluwer学术出版社;2001;45:5-32。
侵袭性指数排名预测水平的不同类型的细菌适应侵入性感染。