自杀脆弱性指数,机器学习模型有助于预测县的风险

自杀是美国的主要死亡原因,但是宾夕法尼亚州立大学研究人员称,曾被用来平等地预测自杀率体重风险因素并依靠大型地理区域的数据的模型限制了预测的准确性。现在,研究人员开发了一种基于机器学习的模型,该模型使用其新开发的自杀性指数(加权风险因素)来识别美国县一级的高风险社区。
该方法最近发表在NPJ心理健康研究。
Paper Paper合着者Soundar Kumara,Allen E. Pearce和Allen M. Pearce工业工程教授说:“我们的目标是在基于机器倾斜的自杀预测模型的帮助下为美国县开发一种新颖的自杀性指数。”在宾夕法尼亚州立大学,他也隶属于信息科学与技术学院。“通过确定自杀率增加风险较高的县,该模型可以帮助促使有针对性的干预计划。”
研究人员在3,140个县的县一级分析了2010 - 19年间的数据,这是疾病控制和预防数据库中最小的地理分类。他们确定了17个用于预测自杀率的特征,可以根据人口统计学,社会 -经济因素和健康。研究人员怀疑,这17个特征中的某些特征将比其他特征更大,他们着手确定哪些因素影响自杀率以及多少。
为了确定每个因素的影响,研究人员使用了Shapley添加性解释(SHAP),这是一种基于游戏理论的方法,该方法解释了每个变量如何促进该模型的预测。
宾夕法尼亚州立医学院公共卫生科学助理教授克里斯汀·塞纳杰德(Kristin Sznajder)的合着者说:“ Shap值通过将预测结果与该功能进行比较,探索每个功能的影响。”哈克生命科学研究所和人口研究所。“使用外形值,确定了预测模型训练集中使用的所有17个功能的重要性。通过识别和隔离分析中的前五个重要特征,我们开发了自杀脆弱性指数。在早期的工作中,创建了此类索引通过包括所有变量而不考虑它们对输出的影响。”
推动自杀预测结果的五个县级特征是人口,非洲裔美国人口百分比,百分比白人人口,中位年龄和女性百分比,其中较高的人口,白人人口百分比和中位年龄与自杀率的增加相关,而非洲裔美国人口百分比和女性百分比人口看到减少自杀率。
宾夕法尼亚州立大学工业和制造工程研究生和论文的第一作者的Vishnu Kumar强调,Shap的价值有所区别机器学习来自先前模型的预测模型。
他说:“几个学科正在广泛使用机器学习来解决数据密集型问题。”“机器倾斜模型通常被称为'黑匣子'解释机器学习模型并帮助我们做出强大,公平,准确的解释和决策的一种非常方便的方法。”
研究人员说,他们希望他们的工作将奠定针对和实施自杀干预计划的基础。
“未来工作的一个令人兴奋的机会是调查使用机器学习技术的可能性,以了解公共卫生政策的变化如何影响率自杀,” Sznajder说。“也许我们的模型可以实现在本地和州一级,以创建可能影响政策和资源分配的预警系统。”
进一步探索