来自互联网搜索和社交媒体的“数字痕迹”能否预测COVID-19的爆发?
你的谷歌搜索和Twitter账户会提醒营销人员你可能想购买什么商品。但是,当COVID-19水平即将上升时,它们也能作为早期预警系统吗?
包括东北大学机器学习专家毛里西奥·桑蒂拉纳在内的一组科学家表示,互联网用户的“数字痕迹”可以用来提醒公共卫生官员到在大规模疫情爆发前一到六周,县一级的COVID-19病例急剧增加。
在1月18日星期三发表的一篇论文中科学的进步Santillana和其他作者说数字数据将有助于弥补现有监测方法留下的信息空白。
东北大学网络科学研究所促进健康和环境改善机器智能小组主任Santillana说,对数据流的分析将使政策制定者能够迅速做出决定,例如是否重新发布屏蔽建议,或增加疫苗接种和促进运动。
桑蒂拉纳说:“我们渴望做的是使用谷歌或亚马逊或任何这些大公司用来向你发送广告的相同信息”,在疫情爆发的早期为公共卫生决策提供信息。
与covid -19相关的数字流包括互联网搜索发烧,临床医生搜索COVID-19治疗方法,以及推特用户关于病得太重不能工作的评论等等。
研究人员还使用了机器学习方法,从2020年1月1日到2022年,美国97个县的疫情中获取历史信息,并将它们结合起来,创建一个单一的预测指标。
Santillana说:“我们的目标不一定是量化有多少感染,而是量化感染急剧增加的时间。”Santillana与波士顿儿童医院、哈佛医学院、俄克拉荷马州立大学和其他组织的科学家一起参与了这项研究。
研究人员发现,州和县两级的预测能力大致相似预警系统在县一级提前一到六周部署,在州一级提前四到六周部署。
该研究表示,数字数据将有助于填补疾病控制和预防中心的重要缺失信息,该中心未能可靠地预测“报告病例和住院治疗趋势的快速变化”。
Santillana说:“当疾病控制与预防中心与公众分享COVID-19预测时,他们经常错过疫情爆发的时间。”他说,在统计实际病例数时,激增已经开始。
“下一章将是疾病预防控制中心说,‘我们知道这是一种预测疫情的替代和补充方式。我们将在内部实施它,我们将把它作为工具箱中的一个额外工具,”Santillana说。
“他说,这项研究是由拜登总统发起的疾病预防控制中心新倡议的一部分,该倡议被称为疾病预防控制中心内的预测和疫情分析中心。”
Santillana说:“正是在这种努力下,我们完成了这篇论文中的工作。”这篇论文发表在美国科学促进会的一份开放获取期刊上。
他说,他和他的团队已经与疾病预防控制中心合作了三到四年,在预测流感发病率和流感住院治疗方面,但他对疾病预防控制中心无法将基于互联网的新型信息来源纳入他们的预测系统感到不满。
“当新冠肺炎来袭时,他们打电话说,‘我们需要所有人齐心协力。所以请尽你所能。’”
“我问他们是否可以灵活一些,因为我和我的团队对创新感兴趣,而不是继续实施完全相同的模型,”Santillana说。
“这个模式并不完美,”他说。
根据这篇关于使用数字痕迹建立前瞻性和实时县级预警系统的论文,研究的县只是美国3006个县的一小部分。
论文称:“我们基于互联网搜索的方法在识字率低和互联网资源有限的地区可能难以发挥良好作用。”
研究人员说,对于互联网接入差或识字困难的县来说,一个可能的解决方案可能是使用州级早期预警系统来指导县级决策。
“当我们在电脑或手机上浏览互联网时,它会留下痕迹,”Santillana说。
他说:“不管我们喜欢与否,现实是大多数公司都利用这些信息来提高利润或利润率。”
“相反,我们希望利用这些信息在下次选举时通知公职人员爆发将会发生。”
更多信息:Lucas M. Stolerman等人,使用数字追踪建立前瞻性和实时县级早期预警系统,以预测美国COVID-19疫情的爆发,科学的进步(2023)。DOI: 10.1126 / sciadv.abq0199