用于训练人工智能识别皮肤癌的数据不足,而且缺乏深色皮肤的图片

皮肤癌
恶性黑色素瘤显微照片。细胞学标本。场污渍。信贷:肾元/与大家

根据NCRI节上发表的一项研究,用于训练人工智能(AI)发现皮肤癌的图像和相关数据不足,而且很少有深色皮肤的图像柳叶刀数字医疗

人工智能越来越多地用于医学,因为它可以诊断疾病癌症更快更有效。然而,人工智能需要通过查看大量诊断已经确定的患者的数据和图像来进行“训练”,因此人工智能程序在很大程度上依赖于它所训练的信息。

研究人员表示,迫切需要更好的数据集和其他的皮肤损伤,其中包含了数据集中代表的人的信息。

该研究由英国牛津大学的温大卫博士主持。他说:“人工智能程序在诊断皮肤癌方面有很大潜力,因为它可以查看图片,快速、经济有效地评估皮肤上任何令人担忧的斑点。然而,了解用于开发项目的图像和患者是很重要的,因为这些会影响到项目在现实生活中对哪些人群最有效。研究表明,只对浅肤色人群的图像进行训练的程序可能对深肤色人群的准确率不高,反之亦然。”

温博士和他的同事首次对所有可自由获取的数据集进行了回顾世界各地。他们发现了21套套装,包括10万多张照片。

皮肤癌的诊断通常需要一张病灶的照片以及一个用一种叫做皮肤镜的特殊手持放大镜拍摄,但在21个数据集中,只有两个数据集包括用这两种方法拍摄的图像。这些数据集还缺少其他重要信息,比如图像是如何被选择纳入的,以及伦理批准或患者同意的证据。

21个数据集中有14个提供了他们来自哪个国家的信息,其中9个包含来自欧洲国家的图像。只有一小部分图像附有患者的肤色或种族信息。在标明肤色的图片中(2436张),只有10张是棕色皮肤,只有一张是深棕色或黑色皮肤。在注明种族的图片中(1585张),没有一张来自非洲人、非裔加勒比人或南亚人的背景。

温博士补充说:“我们发现,对于大多数数据集,关于这些数据集中的图像和患者的许多重要信息没有被报道。关于这些照片是谁拍的、如何拍的以及为什么拍的信息有限。这对从这些项目中开发的程序有影响这是因为它们在不同人群中的表现不确定,尤其是在那些在数据集中没有很好表现的人群中,比如肤色较深的人。这可能会导致这些群体被排除在AI技术之外,甚至受到伤害。

“尽管肤色较深的人较少患皮肤癌,但有证据表明,那些患皮肤癌的人可能会患更严重的疾病,或更有可能死于这种疾病。导致这种情况的一个因素可能是皮肤癌被诊断得太晚。”

为了防止这种情况发生,温博士和他的同事希望为人工智能开发中使用的健康数据制定质量标准。这将包括在数据集中应代表哪些人以及应记录哪些患者特征的信息。

尼尔·史蒂文博士是NCRI皮肤小组的成员,英国伯明翰大学医院NHS基金会信托医学肿瘤学荣誉顾问,他没有参与这项研究。他说:“仅在英国,皮肤癌每年就影响20多万人。有些类型的皮肤癌比其他类型的皮肤癌更具侵袭性,因此快速诊断和治疗至关重要。

“我们已经知道,在我们用来培训医生的教科书中,没有足够多的黑人和亚洲人背景的照片。这篇综述的发现——即深色皮肤的人的照片在数据集中的代表性不足——引发了人们对人工智能辅助皮肤的能力的担忧诊断,尤指在全球背景下的诊断

“我希望这项工作将继续下去,并帮助确保我们在医学上使用人工智能所取得的进展将造福所有患者,认识到人类是高度多样化的。”


进一步探索

许多“高危”美国人并不关心皮肤癌

更多信息:David Wen等,公开可获得的皮肤癌图像数据集的特征:系统综述,《柳叶刀数字健康》(2021)。DOI: 10.1016 / s2589 - 7500 (21) 00252 - 1
由国家癌症研究所提供
引用:用于训练人工智能识别皮肤癌的数据不足,而且缺乏2022年10月28日从//www.pyrotek-europe.com/news/2021-11-ai-skin-cancer-insufficient-lacking.html检索的深色皮肤图片(2021年,11月10日)
本文件受版权保护。除用于个人学习或研究的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。
22股票

反馈给编辑