研究人员使用社交媒体聊天来展示COVID-19的传播情况
乔治亚州立大学的研究人员发布了一批数据来自社交媒体网站推特,以帮助代表全球冠状病毒爆发的传播和影响。
超过1.4亿条推文的数据集作为全球研究界的资源公开提供。
这项工作是收集和跟踪社交媒体聊天记录的研究的一部分,以澄清自然灾害期间的流动模式。在最终确定结果之前公开工作这一罕见步骤突显了全球大流行期间构成的前所未有的威胁。
计算机科学助理教授胡安·班达(Juan Banda)正在领导该项目,并与流行病学家和研究人员合作数据科学家.该数据集将每两天更新一次,可能会产生广泛的影响。
班达说:“在准备几篇相关论文之前就公布这些数据是一个重大决定,但这是为了共同利益。”“我们都生活在同一个星球上,任何其他研究人员可以很容易地分析的额外数据都会产生影响。我是开放科学的忠实信徒,现在绝对是让最多的人关注研究的重要时期。”
这项工作提供了对疫情的独特见解,包括关于旅行、流离失所、诊断、治疗和时间历史记录的信息。Banda与公共卫生学院人口健康科学系主任、数学流行病学教授Gerardo Chowell合作。乔威尔说,这项工作可以确定人们如何在社交媒体上获取和使用信息。
乔威尔说:“这个数据集将使研究人员能够调查与COVID-19有关的错误信息的传播,研究病毒在不同地理区域传播时人口行为和情绪的变化,并量化社会距离努力的影响以及大流行过程中人类流动模式的变化。”
包括研究助理Ramya Tekumalla在内的研究团队开始收集专门用于冠状病毒3月10日。他们已经收集了数百万个印象,可以帮助科学家识别他们可能会忽视的线索。乔威尔和班达用过类似的研究以确定最近全球寨卡病毒爆发期间的模式。
班达说:“这些数据为大流行的影响提供了另一种观点。“虽然大多数努力都集中在感染率、住院率和死亡率上死亡人数就流行病学用途而言,我们的数据集可以用来衡量人们从哪里获得信息(或虚假信息),并衡量人们对政府采取的措施的看法,等等。”
到目前为止,研究人员每天已经收集了近450万条推文。这是数据收集和计算机科学革命的一部分,它提供了实时跟踪大流行期间人们生活的新方法,这在10年前是不可能的。
当世界各地的科学家都在努力减少疫情造成的死亡人数时,班达和他的团队希望这项工作可以改善未来的结果,甚至鼓励公众改变行为。
班达说:“间接地,通过能够处理虚假信息来源,突出人们不遵守规则的例子,我相信我们可以让每个人都尽自己的一份力,使曲线变平。”“在未来的情况下,拥有这些数据将使研究人员能够更好地准备和建立系统来检测社区传播,并设计干预措施,使我们不再处于目前的状况。”
查看数据集在这里.
进一步探索