人工智能方法预测ALS疾病发展
![The architecture of DiseaseCapsule. The input is the concatenation of the compressed features from all Gene-PCA models, where each feature corresponds to one Gene-PCA. The number of Gene-PCAs is 75,584, so the dimensionality of the input is 75,584 × 1. DiseaseCapsule consists of three layers: a fully connected layer (FC), a primary capsule layer (PrimaryCaps) and a phenotype capsule layer (PhenoCaps). The FC layer consists of 150 neurons followed by ReLU as activation function. The PrimaryCaps is composed of 32 primary capsules. Each of them involves four different convolutional filters (kernel size 5 × 1, stride 2, no padding). PhenoCaps consists of two 16-dimensional vectors. Each phenotype capsule receives input from all 32 primary capsules. The output is a binary classification label (Healthy or ALS). Credit: Nature Machine Intelligence (2023). DOI: 10.1038/s42256-022-00604-2 应用人工智能方法预测ALS疾病的爆发](https://scx1.b-cdn.net/csz/news/800a/2023/predicting-outbreak-of.jpg)
肌萎缩性侧索硬化症(ALS)是一种严重的运动神经系统疾病,是遗传性的,但这种遗传性的很大一部分以前一直无法解释。比勒费尔德大学理工学院Alexander Schönhuth教授领导的研究人员使用人工智能(AI)方法,成功记录和破译了3000名ALS患者的基因型谱,从而更多地了解了该疾病的发展。
通过这种新方法,预测人们是否会患上肌萎缩性侧索硬化症的准确率达到87%。研究人员在该杂志上发表了他们的研究结果自然机器智能.
在他的基因组数据科学工作组中,生物信息学家亚历山大教授Schönhuth正在开发方法和工具,以处理数万个基因组并分析它们的数据。除了技术学院,该工作组还属于比勒费尔德大学生物技术中心(CeBiTec)。
Schönhuth团队目前的研究重点是疾病肌萎缩性侧索硬化症(ALS),又称运动神经元病。在渐冻症中,患者的移动能力会随着时间的推移而下降,直到停滞不前。然而,与此同时,大脑的活动仍然完全正常。
“关于肌萎缩性侧索硬化症,我们还有很多不了解的地方,”领导诊断研究的亚历山大Schönhuth说。四年前,他开始研究这个课题,当时他还是荷兰国家数学和计算机科学研究中心阿姆斯特丹维斯昆德与信息中心(CWI)一个研究小组的负责人。“我们知道渐冻症是一种遗传性疾病,但80%的遗传性仍然无法解释,”Schönhuth说。
ALS的遗传结构很复杂
“许多遗传性疾病显示出遗传因素的叠加效应,即所谓的叠加效应。精神分裂症就是一个例子。”Schönhuth解释道。“基因揭示的这些因素越多,一个人患精神分裂症的可能性就越大。因此,我们可以很容易地根据基因来识别遗传倾向。相比之下,ALS的情况要复杂得多。”
Schönhuth和他的团队认为,单独的个人因素很可能导致ALS。然而,如果这些因素同时发生,则情况正好相反:不会发生疾病。这一假设可以解释为什么人们对渐冻症知之甚少。
利用人工智能方法分析3000名ALS患者的遗传数据
中心方法是从人工智能Schönhuth和他的团队应用的人工智能(AI)被称为胶囊网络。它被用来评估基因数据来自3000名渐冻人症患者和7000名未患渐冻人症的患者。
“这种方法的最大优势是它可以捕获重叠的过程。”经典的方法不能处理大量的数据,也不能提供明确的结果。Schönhuth说:“相比之下,我们的人工智能方法清晰易懂地显示了哪些基因及其过程对ALS的发展特别重要。”
超过900个基因被发现在渐冻症的发展中发挥作用
科学家的研究结果显示,预测人们是否会患上ALS的准确率为87%。“我们的方法可以对疾病进行预测,而且比其他方法准确得多。我们已经发现了900多个基因在识别疾病中发挥作用,644个基因以复杂的方式相互作用。这些需要在其他研究领域进一步调查,”Schönhuth继续说道。
“每个基因都参与不同的生物过程:我们了解得越多基因我们对这个过程了解得越多。通过这种方式,我们的研究结果将帮助肌萎缩性侧索硬化症患者适应他们的生活方式,降低他们患这种疾病的风险疾病.此外,还可以开发影响特定过程的药物,”Schönhuth解释道。
更多信息:肖罗等,利用胶囊网络从个体基因型谱预测复杂遗传疾病的患病率,自然机器智能(2023)。DOI: 10.1038 / s42256 - 022 - 00604 - 2