人工智能可能“破解癌症和老年痴呆症的语言”

人工智能可能“破解癌症和老年痴呆症的语言”
活细胞内形成的蛋白质冷凝物的荧光显微镜图像。资料来源:哈佛大学韦茨实验室

科学家发现,Netflix、亚马逊和Facebook使用的强大算法可以“预测”癌症和阿尔茨海默氏症等神经退行性疾病的生物学语言。

数十年研究产生的大数据被输入电脑建立一个模型,看看人工智能是否能比人类做出更先进的发现。

剑桥大学圣约翰学院的学者发现,机器学习技术可以解读癌症、阿尔茨海默氏症等疾病的“生物语言”

他们开拓性的研究发表在《科学杂志》上PNAS在今天,它可能在未来被用于“纠正引起疾病的细胞内的语法错误”。

该论文的第一作者、圣约翰学院(St John’s College)研究员托马斯·诺尔斯(Tuomas Knowles)教授表示:“将机器学习技术引入神经退行性疾病和癌症的研究绝对是一个游戏规则改变者。”最终的目标将是使用开发靶向药物来显著缓解症状或预防痴呆的发生。”

每次Netflix推荐一部连续剧看,Facebook推荐某人做朋友,这些平台都在使用强大的机器学习算法,对人们接下来会做什么做出高度有根据的猜测。Alexa和Siri等语音助手甚至可以识别单个的人,并立即与你“交谈”。

这篇论文的第一作者、圣约翰学院(St John's College)研究员卡迪·里斯·萨尔(Kadi Liis Saar)博士使用类似的机器学习技术训练了一个大规模的语言模型,以研究当体内的蛋白质出现问题导致疾病时,会发生什么。

人工智能可能“破解癌症和老年痴呆症的语言”
活细胞内形成的蛋白质冷凝物的荧光显微镜图像。资料来源:哈佛大学韦茨实验室

她说:“人体是成千上万种蛋白质的家园,科学家们还不知道其中许多蛋白质的功能。我们问了基于语言模型学习蛋白质语言。

“我们特别要求程序学习生物分子凝聚物(细胞中发现的蛋白质液滴)的变形语言,这是科学家们真正需要理解的,以破解生物学功能和导致癌症和阿尔茨海默氏症等神经退行性疾病的故障语言。”我们发现,在没有明确告知的情况下,它可以学习科学家经过几十年研究发现的蛋白质语言。”

蛋白质是在人体中扮演许多重要角色的大型复杂分子。它们在细胞中完成大部分工作,并且是人体组织和器官的结构、功能和调节所必需的——例如,抗体是一种具有保护身体功能的蛋白质。

阿尔茨海默氏症、帕金森氏症和亨廷顿氏症是三种最常见的神经退行性疾病,但科学家认为还有数百种。

阿尔茨海默病影响着全世界5000万人,在这种疾病中,蛋白质会变得异常,形成结块并杀死健康的神经细胞。一个健康的大脑有一个质量控制系统,可以有效地处理这些潜在危险的大量蛋白质,也就是所谓的聚集物。

科学家们现在认为,一些无序的蛋白质也会形成称为冷凝物的液体状的蛋白质液滴,这种液滴没有膜,可以自由地相互融合。与不可逆的蛋白质聚集物不同,蛋白质冷凝物可以形成和重组,通常与熔岩灯中变形的蜡块相比较。

诺尔斯教授说:“蛋白质冷凝物最近引起了科学界的广泛关注,因为它们控制着细胞中的关键事件,比如基因表达——我们的DNA如何转化为蛋白质——蛋白质合成——细胞如何制造蛋白质。”

人工智能可能“破解癌症和老年痴呆症的语言”
活细胞内形成的蛋白质冷凝物的荧光显微镜图像。资料来源:哈佛大学韦茨实验室

“任何与这些蛋白滴有关的缺陷都可能导致疾病,比如癌症。这就是为什么要把自然语言处理技术引入到分子起源的研究中如果我们想要纠正导致疾病的细胞内的语法错误,功能失调是至关重要的。”

萨尔博士说:“我们给算法提供了已知蛋白质的所有数据,这样它就可以学习和预测蛋白质的语言,就像这些模型学习人类语言以及WhatsApp知道如何建议你使用的单词一样。”

“然后,我们可以询问它导致一些蛋白质在细胞内形成冷凝物的具体语法。这是一个非常具有挑战性的问题,解开它将帮助我们学习疾病语言的规则。”

由于数据可用性的提高,计算能力的增强,以及技术进步产生了更强大的算法,它的发展速度非常快。

机器学习的进一步应用可能会改变未来的癌症和神经退行性疾病研究。科学家们的发现可能会超出目前已知和推测疾病的范围,甚至可能超出人类大脑在没有机器学习的帮助下能够理解的范围。

萨尔博士解释说:“机器学习可以摆脱研究人员认为的科学探索目标的限制,这将意味着我们将发现我们甚至还没有想到的新联系。这确实非常令人兴奋。”

该网络现已向世界各地的研究人员免费开放,以使更多的科学家能够进行研究。


进一步探索

研究人员发现了一种罕见的遗传性痴呆症

更多信息:Kadi L. Saar等,从序列决定因子和嵌入中学习蛋白质缩合物的分子语法,美国国家科学院院刊(2021)。DOI: 10.1073 / pnas.2019053118
所提供的剑桥大学
引用人工智能可以“破解癌症和阿尔茨海默氏症的语言”(2021年4月8日
本文件受版权保护。除以私人学习或研究为目的的公平交易外,未经书面许可不得转载任何部分。内容仅供参考之用。
897股票

反馈给编辑

用户评论