Synthetic Data from Diffusion Models Improves ImageNet Classification

Shekoofeh Azizi, Simon Kornblith, Chitwan Saharia, Mohammad Norouzi, David J. Fleet

论文:https://arxiv.org/pdf/2304.08466.pdf 

  • 动机:研究利用文本到图像扩散模型进行数据增广在图像分类任务中的效果。
  • 方法:利用大规模的文本到图像扩散模型进行数据增广,并将其应用于图像分类任务中。
  • 优势:该方法在ImageNet分类任务中表现出色,可以显著提高分类准确性。

研究了利用大规模文本到图像扩散模型进行数据增广,并将其应用于图像分类任务中。研究表明,利用这种方法可以显著提高ImageNet分类的准确性。

深度生成模型正变得越来越强大,现在可以在文本提示下生成各种高保真的照片现实样本。他们是否已经达到了这样的程度:自然图像的模型可以用于生成数据的增强,帮助改善具有挑战性的判别任务?我们表明,大规模的文本到图像扩散模型可以被微调,以产生具有SOTA FID(256x256分辨率下为1.76)和Inception Score(256x256分辨率下为239)的类条件模型。

该模型在分类精度分数上也产生了新的SOTA(256x256生成样本为64.96,1024x1024样本提高到69.24)。用产生的模型的样本来增强ImageNet训练集,在ImageNet分类精度上比强大的ResNet和Vision Transformer基线有了明显的改善。

 
图片
 

内容中包含的图片若涉及版权问题,请及时与我们联系删除