机器学习模型等级预测阿尔茨海默氏症的风险
成人一旦到65岁,阈值的阿尔茨海默病的发病年龄,他们的遗传风险的程度可能超过年龄的预测是否会致命的大脑功能紊乱,一项新的研究表明。
这项研究最近发表在杂志上科学报告,是第一个结构机器学习模型与遗传风险评分、非遗传信息和电子健康记录数据从近一百万个人排名风险因素为了他们的协会是多么强大的最终阿尔茨海默氏病的发展。
研究人员使用模型对预测的风险因素两个种群的英国生物库:白色的年龄在40岁以上,65岁以上的人占成年人的一个子集。
结果表明,年龄构成了三分之一的总风险,85岁,根据阿尔茨海默氏症协会阿尔茨海默氏症的最大风险因素在整个人口,但是老年人,由遗传风险多基因风险评分更有预测性。
“我们都知道阿尔茨海默病是一种later-onset疾病,所以我们知道年龄是一个重要的危险因素。但当我们只考虑风险对于65岁以上的人来说,然后由多基因遗传信息捕获风险评分排名高于年龄,“孝义雷蒙德高,主要研究作者说副教授眼科及视觉科学和生物医学信息学在俄亥俄州立大学医学院的。“这意味着真的很重要考虑对阿尔茨海默病遗传信息当我们工作。”
家庭收入低也成为一个重要的风险因素,排名第三或第四后年龄和遗传的影响。
“找到相关收入是非常,非常有趣,”高说,也属于俄亥俄州立大学人类遗传学部门的教师、实验室使用的生物医学大数据和人工智能研究阿尔茨海默氏症和眼部疾病背后的基因。“我们都想有一个健康的生活,和收入可以这样一个重要的因素决定你能吃的,你可以住在哪里,教育水平,获得保健所有这些可能导致阿尔茨海默病。”
457936年英国生物库的参与者在示例中,2177人了阿尔茨海默氏症和455759没有,和88309 65或以上。
一些非遗传性危险因素之间的不同的人,没有阿尔茨海默病(AD)引人注目:结果表明,人的广告,较高的收缩压和舒张压降低更常见,糖尿病是更普遍,家庭收入和教育较低,和最近下降,听力困难和母亲的广告更高的历史。
前20名的风险因素列表的全部样本的成年人还包括诊断高血压尿路感染,抑郁发作、昏厥、未指明的胸痛、定向障碍和异常减肥。其他风险因素在前20位65岁及以上的人包括高胆固醇和步态异常。这些发现显示的力量从电子健康记录条件代码添加到模型。
“机器学习可以探索这些特性之间的关系,或变量,选择顶部的重要特征和等级某些特性,更有助于老年痴呆症的风险比其他特性,”高说。“通常情况下,这不是好非常肥胖,但我们也看到,一个较低的身体质量指数是不好的。高血压通常是不好的,但在这里,我们看到低舒张压是不好的。模型揭示了一些有趣的模式。”
建筑模型是一个两步的过程。团队第一次进行全基因组关联研究使用数据从阿尔茨海默病遗传财团来识别基因变异与整体患阿尔茨海默氏症的风险和疾病的发展在一个特定的年龄。单独的变量的集合被用来建立两个多基因风险评分,这跨基因组的遗传效应合并成一个为每个风险的衡量指标。
这些分数被应用于英国生物库参与者的DNA数据并结合生物信息传统的风险因素,如性别、教育、体重指数和血压,和11000多名电子健康记录条件代码引用的个人记录。
该小组还使用了一个算法在解释模型的输出,以确保风险因素变量加权的客观分析。
我们与生俱来的遗传疾病的风险已经建立,但信息其他健康和社会经济因素如何影响我们的老年痴呆症风险的青光眼,也高studies-gives美国实力采取预防措施,他说。
“如果人们知道更多关于风险因素,他们可以调整他们的生活方式。阿尔茨海默氏病和青光眼,没有治愈,所以预防可以帮助很多,”高说。“我也希望构建模型使这些预测可以帮助药物开发和有效和低成本的筛查项目。”
更多信息:孝义雷蒙德高et al,可辩解的机器学习总量多基因的阿尔茨海默氏症的风险分数和电子健康记录预测,科学报告(2023)。DOI: 10.1038 / s41598 - 023 - 27551 - 1