机器学习模型关注新闻报道,预测食品危机爆发
一组研究人员开发了一种机器学习模型,可以从新闻文章的内容中有效预测面临粮食不安全风险的地区。该模型可用于帮助在脆弱地区优先分配紧急粮食援助,标志着比现有测量方法有所改进。
“我们的方法可以利用实时信息流和易于解释的预测模型,大幅提高对粮食危机爆发的预测,最多可提前12个月,”纽约大学Courant数学科学研究所的访问研究员、世界银行的数据科学家、该研究报告的作者之一Samuel Fraiberger说科学的进步.
“传统的粮食不安全风险因素衡量方法,如冲突严重程度指数或粮食价格变化,往往是不完整、滞后或过时的,”Courant研究所教授、该论文的作者之一Lakshminarayanan Subramanian补充说。“我们的方法利用了这样一个事实,即引发粮食危机的风险因素在新闻中被提及,而传统的衡量方法则无法观察到。”
粮食不安全威胁着全世界数亿人的生命。根据联合国粮食及农业组织的数据,营养不良人数从2014年的6.24亿人增加到2019年的6.88亿人。该论文的作者指出,自那时以来,由于COVID-19大流行,情况已经恶化,气候变化以及武装冲突——2021年,全球有7.02亿至8.28亿人面临饥饿。此外,2021年全球和每个区域的严重粮食不安全状况都有所增加。
尽管这一苦难具有严重和广泛的性质,但目前检测未来粮食危机的方法依赖于风险措施,这些措施不够充分,阻碍了应对这些危机的努力。
在努力开发一个更好的模型的过程中,这篇论文的作者,包括库朗大学的博士研究生Ananth Balashankar,考虑了这样一种可能性新闻报道该网站提供当地事态发展的实时现场报道,可以作为即将到来的粮食危机的早期预警系统。
研究人员收集了1980年至2020年间发表的近40个粮食不安全国家的1100多万篇新闻文章。然后,他们开发了一种方法,从这些文章中提取与粮食不安全有关的特定短语,并以引人注目的细节捕捉新闻评估。具体来说,该工具考虑了近170个文本特征,以便正确衡量与粮食不安全有关的短语的语义,并在文章出现时进行标记。以下是南苏丹的一个例子,概述了地点和风险因素:“饥荒可能会重新出现在该国的一些地区,特别是皮博尔县东部,那里的洪水和虫害破坏了作物。”
然后他们考虑了一系列食品不安全的数据风险因素-例如冲突死亡人数,降雨量,植被和变化食品价格-确定这些因素在被研究国家和地区的新闻提及与它们的发生之间是否存在相关性。在这里,他们发现覆盖的性质与这些因素的实地发生之间存在高度相关性,这表明新闻报道是研究条件的准确指标。
但是为了确定新闻文章事实上,这些报道是预测未来粮食危机的一个很好的指标,研究小组需要知道这些报道的性质是否是未来危机的一个可行指标,以及这些报道是否比传统的测量方法更准确。研究人员使用一组较小的新闻故事,发现从2009年到2020年,在21个粮食不安全的国家,新闻报道在地方层面上产生了更准确的预测食品不安全并且比不包括新闻文本的传统测量方法提前12个月进行测量。值得注意的是,他们还发现,用新闻报道补充传统的预测措施进一步提高了预测的准确性粮食危机预测,表明了“混合”模型的价值。
研究人员还看到了他们工作的潜在更大用途。
Balashankar说:“新闻指标可以扩展到预测疾病暴发和气候变化的未来影响。”
更多信息:Ananth Balashankar等人,利用信息流预测粮食危机,科学的进步(2023)。DOI: 10.1126 / sciadv.abm3449.www.science.org/doi/10.1126/sciadv.abm3449