为什么短期预报可以比模型预测流行病的发展如何

确认COVID-19例已经过去了1000万年:他们将在下周,在全球范围内和在你的国家吗?
有一个好的评估可以帮助卫生当局和他们的反应和指导政府缓解封锁。为此,我们已经出版实时预测对确诊病例和死亡世界许多地方在3月20日以来几乎每天。这些在很大程度上被可靠指标的预计会在下周发生。
许多更正式的模型预测pandemic-such广为人知伦敦帝国理工学院数学模型,引导英国政府的response-use试图解释爆发的基础流程,并通过采用少量的可判断的参数(如R数字)。他们了解疫情,并以此为根据做出推测。
我们预测,另一方面,不要试图理解为什么发生变化。相反,他们纯粹是基于当前流行的数据,看看它已经进化和转移到预测接下来会发生什么。这经常导致更准确的预测。
为什么流行病学模型可以斗争呢
想象你是通过公路从波士顿到加州旅行。知道加州从以前的旅行目的地,我们跟踪你的旅程,试图预测每天的行程。当有道路关闭,你短暂绕道,我们预测出错,然后恢复。许多模型这样一个内置“均值回归”,可以处理这些微小的变化。

通常这个模型运行良好。但是如果你听说加州野火,决定去加拿大呢?预测变得越来越贫穷,如果我们认为,你还是去加利福尼亚。的模型需要从这种“结构性破坏”中恢复过来。
大多数模型在社会科学和流行病学理论背后,是基于现有证据从过去。这个简单的例子展示了为什么旅行这样的模型可能不是好让预测:他们过于高度风险由理论formulations-such你去加州。
英国预算责任办公室的预测的生产力在2008年金融危机后是一个伟大的例子,当这样的模型出错。看到可爱的图可以从他们历史预测数据库。我们称之为刺猬图表,因为非常错误的预测看起来像刺离开确认数据。
在流行病学,大多数模型有一个良好的理论基础。然后他们慢慢开始考虑流行,成倍增加,最终放缓。然而,人类行为和政策反应会导致突然的变化,很难允许(比如意外来访的加拿大)。数据也可能突然转变pandemic-ramping测试可以揭示许多新的感染,或在看护之家的情况下可能会突然加入数据集。在此类环境中是有效的,预报设备必须足够强大来处理问题的变化趋势和突然的变化结果和测量。我们的短期预测可以处理这个问题在某种程度上更正式的模型往往不能。
我们的预测工作,并执行如何
创建我们的预测认为,COVID-19总数的情况下在一个国家首先创建基于数据证实,趋势线。每次添加一个新的数据点,这将创建一个新趋势所以有尽可能多的趋势线数据点。机器学习算法选择可用的所有这些趋势,物质,和那些选择平均展示过程随时间演变的趋势(数据)。预测来自这个基本趋势,以及通过观察早期预测和实际结果之间的差距。

这也许让人感到吃惊,但这是可行的。下面的图显示了我们做出的预测5月22日英国如何COVID-19病例总数将增加在未来一周左右(固体红线)。我们的预测5月30日是在272000年。报告的结果是272826。
第二个图显示了欧盟COVID-19死亡,我们的预测在3月和4月。连续预测了随着时间的推移被显示为红色,灰色与实际数据点。灰色和红色线之间的重叠显示,这里的预测非常准确。比较近的聚束线前面提到的刺猬图!
然而,一个更精确的判断预测的准确性的方法是看一个叫做平均绝对误差(MAE)的措施。绝对错误的数值差异预测和实际值是什么;梅是一组的平均差异。美提供了一个通用的远离你的预测。
4月4日,美对我们one-week-ahead预估COVID-19死亡的主要欧洲国家是629年,而平均预测的伦敦帝国理工学院COVID-19响应团队死亡在同一国家同一时期的1068年。平均将下周的数据时,我们的预测是在大致相同的金额- 678而帝国的美已经增长到了1912。在4月11日,我们美数字开始镜像彼此的,但至少在大流行的早期阶段,我们似乎更准确的预测。
在大流行期间,这些预测为未来一周提供有用的见解,现在拉丁美洲爆发的中心,泛美开发银行等机构使用它们。不仅是我们预测的更健壮的方式发挥作用在当前流感大流行,我们相信它在第二波可能是至关重要的。