DODA: Diffusion for Object-detection Domain Adaptation in Agriculture

简介

最近生成模型生成的多样化和高质量内容展示了使用合成数据训练下游模型的巨大潜力。然而，在视觉领域，特别是目标检测方面，相关领域尚未得到充分探索，合成图像仅用于平衡现有数据集的长尾，并且生成标签的准确性较低，生成模型的全部潜力尚未得到利用。本文提出了DODA，一种数据合成器，可以为农业领域的新领域生成高质量的目标检测数据。具体而言，我们通过将布局编码为图像来提高布局到图像的可控性，从而提高标签的质量，并使用视觉编码器为扩散模型提供视觉线索，以将视觉特征与扩散模型分离，赋予模型在新领域生成数据的能力。在全球小麦穗检测（GWHD）数据集上，该数据集是农业领域最大的数据集，包含多种领域，在使用DODA合成的数据时，目标检测器的性能在明显偏离训练数据的领域中提高了12.74-17.76 AP$_{50}$。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在提出一种名为DODA的数据合成器，用于生成高质量的农业领域的目标检测数据，以解决当前合成数据在目标检测中应用的问题。
关键思路

DODA通过将布局编码为图像来提高布局到图像的可控性，从而提高标签的质量，并使用视觉编码器为扩散模型提供视觉线索，使模型具有在新领域生成数据的能力。
其它亮点

论文在全球小麦头检测（GWHD）数据集上进行了实验，使用DODA合成的数据显著提高了目标检测器的性能，并在新领域中提高了12.74-17.76 AP$_{50}$。此外，论文还开源了代码。
相关研究

最近的相关研究包括《Learning to Synthesize 3D Point Clouds with Conditional Generative Adversarial Networks》、《Semantic Image Synthesis with Spatially-Adaptive Normalization》等。

DODA: Diffusion for Object-detection Domain Adaptation in Agriculture

提问交流

提问交流