SPIE Journal宣布公开访问最大的多质量医学成像数据集
今天发表的一篇论文医学成像杂志- “深度:大规模病变注释和通用病变检测的自动化开采,并进行深度学习, - 避免了公众可访问的最大CT病变图像数据库的开放性。学习算法;到目前为止,尚未公开可用的大规模注释的放射学图像数据集(对于开发深度学习方法的开发至关重要)。
由美国国立卫生研究院临床中心的团队开发的Deeplesion是通过从其自己的图片归档和通信系统中挖掘历史医学数据来开发的。这个新数据集在开始计算机辅助检测(CADE)和诊断(CADX)领域具有巨大的潜力。
这数据库包括多种病变类型,包括肾脏病变,骨骼病变,肺结核和淋巴结肿大。迄今为止,缺乏多类病变数据集已成为开发能够检测多种病变类型的更通用的CADE框架的主要障碍。多类病变数据集甚至可以实现自动化放射学诊断的CADX系统的开发。
该数据库是使用图像存档中医学图像中临床意义的发现的注释(预订标记)构建的。在分析了这些书签的特征之后,这些书签以不同的形式,包括箭头,线条,椭圆,细分和文本 - 团队收获并分类了这些书签以创建Deeplesion数据库。
尽管计算机视野可以访问包含数百万张图像的可靠Imagenet3数据集,但医学成像字段无法访问相同数量的数据。大多数公开可用的医疗图像数据集仅包含数十或数百例。从10,000多个案例研究中有超过32,000个注释的病变,DeepLeperion数据集现在是最大的公开医疗图像数据集。
“我们希望数据集将使ImageNet受益于计算机视觉区域的医学成像区域,”论文的主要作者,医学博士Ronald Summers实验室的博士后研究员Ke Yan说。
除了构建数据库外,团队还根据数据库开发了通用病变检测器。研究人员指出,病变检测是放射科医生的一项耗时的任务,但是诊断的关键部分。该探测器可能能够作为放射科医生或其他专业凯德系统的初始筛选工具。
除病变检测外,深层数据库还可以用于分类病变,检索病变基于查询字符串,或根据数据库中现有模式预测新病例的病变增长。数据库可以下载https://nihcc.box.com/v/deeplesion。
未来的工作将包括将数据库扩展到其他图像模式,例如MR,包括来自多家医院的数据,以及提高检测器算法的检测准确性。
进一步探索