机器学习模型正在帮助CDC预测COVID-19的传播
加州大学洛杉矶分校塞缪尔利工程学院开发的机器学习模型正在帮助疾病控制和预防中心预测COVID-19的传播。
该模型是由加州大学洛杉矶分校计算机科学助理教授顾泉泉(音译)领导的团队创建的,现在它是用于计算机科学研究的13个模型之一COVID-19预测中心麻省大学阿默斯特分校。来自该中心的数据,反过来又会反馈给疾病控制中心在线预测疾病如何继续传播
顾说,他的模型比大多数其他人更准确,因为它不仅仅依赖于确诊的COVID-19病例和死亡人数。它是流行病学驱动的,是该中心仅有的两个使用模型之一机器学习.
模特的名字,UCLA-SuEIR,是根据五种类型的观察和推断的COVID-19数据得出的,这些数据被纳入其预测,即分类为易感、未报告、暴露、传染性和已康复的病例数。
加州大学洛杉矶分校的模型是独特的,因为它不简单地适合当前的曲线,这只是基于报告的病例。相反,它从模型的数据分析中推断出未检测和未报告病例的数量,并使用这些推断来预测疾病传播的速度。这被称为“流行病模型”,因为它考虑了影响疾病传播速度的各种因素。
加州大学洛杉矶分校- sueir根据死亡人数和已确认的死亡人数制作州和县一级的模型由《纽约时报》以及基于约翰霍普金斯大学(Johns Hopkins University)报告数据的国家模型。
5月6日,在顾将他的工作细节发送给马萨诸塞大学生物统计学教授尼古拉斯·赖希(该中心的项目负责人)后,马萨诸塞大学将加州大学洛杉矶分校的模型添加到其中心。顾的团队注意到,中心的几个模型产生了不同的预测,大部分是基于曲线拟合模型。
“在没有任何流行病建模的情况下,曲线拟合模型的预测非常具有误导性,因为它只依赖于观测到的数据模式,而忽略了驱动数据的潜在流行病动态,”Gu说。
加州大学洛杉矶分校的团队通过在未来确诊病例、死亡病例和康复病例前一周做出预测,然后与实际报告的数据进行验证,来检查模型的准确性。该模型的机器学习算法使Gu能够在不到5秒的时间内训练出一个新的原型,并允许团队每天更新其模型,这比其他模型更高效。谷的团队实际上总共创建了232个子模型——一个针对美国整体,一个针对每个州,181个针对任何确诊病例超过1000例的县。
顾说,加州大学洛杉矶分校的模型在马萨诸塞州中心预测美国和大多数州的死亡人数方面一直是最准确的,并且是与全国报告的实际死亡人数最吻合的前三个模型之一。
这项工作不仅仅是数学练习。谷说:“我们的模型可以帮助衡量政府政策的有效性,如社交距离、居家令、口罩和面罩的使用或自我隔离,以及预测随着各州重新开放,病例可能重新出现。”
该模型还可用于评估一个地区是否对足够多的人进行了检测,这可以帮助官员了解是否需要进行更多的检测。
根据该团队的预测,美国新冠肺炎病例总数将于6月1日达到峰值,加州将于7月1日达到峰值,洛杉矶将于6月7日达到峰值。
顾的团队正致力于改进模型考虑来自医院和重症监护病房的县级数据,这些数据可以产生预测,当局可以利用这些数据更好地分配卫生保健人员、个人防护设备和呼吸机等资源。