在肝脏疾病的人工智能工具筛查中显示出性别偏见
伦敦大学学院研究人员的一项新研究发现,通过血液测试来预测肝脏疾病的人工智能模型在女性中漏检的可能性是男性的两倍。
这项研究发表在英国医学杂志健康与保健信息学他重新创建了四个在之前的研究中记录的人工智能模型,这些模型的准确率超过70%成功率在识别肝脏疾病血液测试的结果
在重建算法并证明它们获得了与早期研究相同的结果后,研究小组观察了它们按性别表现的情况,发现它们遗漏了44%的肝脏病例疾病女性中,男性为23%。
研究人员发现,两种被认为在筛查患者疾病方面表现最好的算法总体上存在最大的性别差距——也就是说,与男性相比,女性的表现最差。
该研究的主要作者、博士候选人Isabel Straw博士(伦敦大学学院健康信息研究所)说:“人工智能算法越来越多地用于医院,以协助医生诊断患者。我们的研究表明,除非对这些算法进行偏见调查,否则它们可能只会帮助一小部分患者,而让其他群体得到更差的护理。”
斯特劳博士说:“我们需要非常小心,医疗人工智能不会加剧医疗保健领域现有的不平等。当我们听到一个算法在识别疾病时准确率超过90%,我们需要问:对谁准确?总体上的高精度可能掩盖了某些群体的糟糕表现。”
研究人员调查的人工智能模型已经使用印度肝脏患者数据集(ILPD)进行了训练,该数据集广泛用于创建预测肝脏疾病的算法。
研究人员指出,人工智能模型对男性和女性的表现差异可能反映了护理方面现有的不平等。算法所使用的疾病生化标记,如较低的白蛋白水平,已经被临床医生广泛使用,似乎是男性疾病的更有效指标。
过去的研究表明,女性被诊断出患有肝病的可能性较小,但患肝病的可能性也更大严重的疾病结果更糟。
在这篇最新论文中,研究人员查看了30项描述肝脏疾病筛查算法的研究,尽管护理差异可能会导致人工智能的偏见,但他们发现没有一项研究讨论了性别差异。
研究人员无法评估不同种族的人工智能模型的表现,因为他们没有数据相关数据但他表示,有证据表明,用于预测肝脏疾病的标志物对边缘种族群体的效果较差。
在欧洲,因长期损伤而导致的肝脏瘢痕,估计有1.8%的人死于肝硬化。常见的原因包括多年饮酒过量;长期感染肝炎,特别是乙型或丙型肝炎;也是一种严重的非酒精性脂肪肝病(NAFLD)。
进一步探索