TSynD: Targeted Synthetic Data Generation for Enhanced Medical Image Classification

2024年06月25日
  • 简介
    使用医学图像数据进行大规模机器学习的训练是非常具有挑战性的,因为这种数据稀缺且生成数据注释的成本很高,通常需要医疗专业人员的参与。生成模型的快速发展使得利用大量逼真的合成数据来进行训练成为可能。然而,随机选择合成样本可能不是最优策略。在这项工作中,我们研究了有针对性地生成合成训练数据,以提高图像分类的准确性和鲁棒性。因此,我们的方法旨在引导生成模型合成具有高认识不确定性的数据,因为大量认识不确定性表明训练集中存在代表不足的数据点。在图像生成过程中,我们将由自动编码器重建的图像馈送到分类器中,并计算类概率分布的互信息作为不确定性的衡量标准。通过优化过程改变自动编码器的特征空间,以最大化解码图像上的分类器不确定性。通过对这样的数据进行训练,我们提高了在几个分类任务中的性能和对测试时间数据增强和对抗攻击的鲁棒性。
  • 作者讲解
  • 图表
  • 解决问题
    如何利用生成模型生成高质量的医学图像数据,以提高图像分类的准确性和鲁棒性?
  • 关键思路
    通过指导生成模型生成具有高认知不确定性的合成数据来改善分类器的性能和鲁棒性,从而优化特征空间,提高分类器对重建图像的不确定性。
  • 其它亮点
    论文通过优化特征空间,指导生成模型生成具有高认知不确定性的合成数据,从而提高分类器的性能和鲁棒性。实验表明,该方法能够提高分类器对测试数据增强和对抗性攻击的鲁棒性。
  • 相关研究
    在医学图像数据生成和分类方面,还有一些相关研究,如《Synthetic Medical Images from Dual Generative Adversarial Networks》和《Using Deep Learning to Adress the Challenge of Class Imbalance in Medical Image Classification》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问