基于人工智能图像处理的宫颈癌精确检测新算法
宫颈癌每年影响50多万妇女,造成30多万人死亡。在早期发现癌症对于从患者体内根除疾病至关重要。然而,常规人群癌症筛查受到其昂贵和劳动密集型检测过程的限制。为了检测恶性肿瘤,临床医生需要从包含超过10万个宫颈细胞的染色切片中对单个细胞进行分类。
因此,计算机辅助诊断(CAD)系统是一个可行的选择,方便和快速的癌症检测。
圣彼得堡理工大学自动化与控制过程系副教授Dmitrii Kaplun说:“传统的基于机器学习的方法,尽管计算不太复杂,但需要提取手工特征,并选择特征进行分类。”这限制了这种模型的性能,因为两个主要原因:对于复杂的数据模式,手工特征的提取变得困难,所有这些特征可能没有足够的信息,从而对模型的性能产生不利影响模型的表现。”
考虑到这一点,研究人员提出了一种新技术。他们使用三种卷积神经网络(CNN)架构——inception v3、Xception和DenseNet-169,形成了一个基于集成的分类模型。集成学习是一种需要考虑两个以上模型来做出最终预测的策略。在ImageNet数据集上对神经网络进行预训练,用于Pap染色单细胞和整片图像的分类。
Kaplun说:“所提出的集成方案使用了基于模糊等级的分类器融合,通过考虑由所述基础学习者生成的决策分数上的两个非线性函数。”“与文献中存在的简单融合方案不同,所提出的集成技术通过考虑基分类器预测的置信度,对测试样本进行最终预测。”
该模型已在两个公开的基准数据集上进行了评估,即SIPaKMeD巴氏涂片和Mendeley液体细胞学(LBC)数据集,使用了5倍交叉验证方案。在SIPaKMeD巴氏涂片数据集上,所提出的框架在2类设置中实现了98.55%的分类准确率和98.52%的灵敏度,在5类设置中实现了95.43%的准确率和98.52%的灵敏度。在Mendeley LBC数据集上,实现的精度为99.23%,灵敏度为99.23%。
研究结果发表在该杂志上科学报告.提出的模型似乎优于许多最先进的模型,证明了它的有效性。
这个快速识别工具可以作为即插即用模型使用。进行宫颈癌筛查只需要临床医生的最低限度支持。因此,适合在这个医学领域使用。
研究人员希望尝试对比度增强技术或预先分割细胞,以便在图像对比度差或存在重叠细胞的情况下更准确地分类。他们也可以考虑其他基本学习器的集合,并探索不同的秩生成函数来执行集合。