MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions

简介

将基于神经网络的系统整合到临床实践中的难题在于领域泛化和鲁棒性。计算机视觉社区建立了ImageNet-C等基准，作为衡量在这些挑战方面取得进展的基本前提。医学影像社区中类似的数据集很少，缺乏跨影像模态和应用的综合基准。为了填补这一空白，我们创建并开源了MedMNIST-C，这是一个基于MedMNIST+数据集的基准数据集，涵盖12个数据集和9种成像模态。我们模拟不同严重程度的任务和模态特定的图像破坏，全面评估已建立算法对真实世界工件和分布变化的鲁棒性。我们进一步提供定量证据，表明我们简单易用的人工破坏可以实现高性能、轻量级的数据增强，以增强模型的鲁棒性。与传统的通用增强策略不同，我们的方法利用领域知识，在与广泛采用的方法相比时表现出明显更高的鲁棒性。通过介绍MedMNIST-C并开源相应的库以实现有针对性的数据增强，我们为针对医学影像挑战的越来越鲁棒的方法的发展做出了贡献。代码可在https://github.com/francescodisalvo05/medmnistc-api上找到。
图表
解决问题

论文试图解决缺乏跨模态和跨应用程序的医学图像数据集的问题，以及缺乏综合基准来评估模型的鲁棒性和泛化能力。
关键思路

论文提出了一个名为MedMNIST-C的基准数据集，它基于MedMNIST+收集，涵盖12个数据集和9种成像模式。通过模拟不同严重程度的任务和模态特定的图像破坏，全面评估了现有算法对真实世界伪影和分布变化的鲁棒性。同时，论文提出了一种简单易用的人工破坏数据增强方法，可以提高模型的鲁棒性。
其它亮点

值得关注的是，MedMNIST-C可以用于评估医学图像处理算法的鲁棒性和泛化能力，同时提供了一种简单易用的数据增强方法。论文还提供了开源代码，并且展示了该方法在不同数据集上的实验结果。值得进一步研究的是如何进一步提高模型的鲁棒性和泛化能力。
相关研究

最近的相关研究包括使用对抗性攻击评估医学图像处理算法的鲁棒性。例如，"Adversarial Attacks and Defenses in Medical Imaging: A Systematic Review"和"Adversarial Attacks on Medical Deep Learning Models: A Systematic Review"。

MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions

评论