一项研究揭示了使用社交媒体来确定健康研究中的种族和民族的缺陷
通过使用社交媒体数据,研究人员可以深入了解患者的经历,而这些经历往往被忽视或难以获得。与传统的流行病学研究相比,社交媒体提供数据的速度更快,后者可能需要数年时间才能完成。
趋势
如果研究人员能够确定关键的人口统计数据社交媒体他们可以帮助用户确定谁代表过多或不足,并帮助发现趋势,收集关于不同群体的观点和经验的信息。
虽然之前的研究着眼于提取或估计位置、年龄、性别、语言、职业和阶级等特征,但这项研究是第一次对提取种族或民族的方法进行全面综述。
这项研究的作者由约克大学领导,并发表在《卫报》上医学互联网研究杂志他们已经确认了身份伦理问题以及对使用Twitter评估用户种族的可靠性的怀疑。
他们表示,如果不解决这些限制,可能会降低所发现信息的价值。
这项针对美国推特用户的研究发现,研究人员通常依赖于推特用户的个人简介、照片和推文本身的信息,经常分析使用的语言,并识别任何自我声明。
偏见
该研究的主要作者、约克大学健康科学系的苏·戈德博士说:“提取推特用户的种族和民族特征,对于确定种族和民族多样性人群的趋势、经历和态度尤为重要。”
“但我们需要对所使用的方法保持敏感,并注意偏见。例如,当研究人员看照片时,他们倾向于认为自己的种族,而使用别人的名字对经常使用伴侣名字的女性来说是不利的。”
该研究的作者表示,另一个问题是将种族过度简化为黑人、白人和亚洲人。
研究人员提出了几种提高识别能力的新方法比赛或者来自社交媒体的种族,包括更有代表性的研究团队,混合了手工和计算方法识别自我声明。
差距
戈德博士补充说,“Twitter数据的吸引力是显而易见的,因为它是最大的公众面对的数据之一社交媒体平台它的用户群体是不同民族的。”
“然而,从推特数据中获得的有前景的见解往往受到缺失的限制,特别是每个用户的基本社会人口信息。”
“为了利用社交媒体和数字健康研究来解决差异,我们不仅需要知道推特上说了什么,还需要知道谁说了什么。”
更多信息:Su Golder等人,建立Twitter用户种族或民族的方法:范围审查,医学互联网研究杂志(2022)。DOI: 10.2196/35788