- 简介本研究展示了扩散模型在工业场景中可以用于改善表面缺陷检测中数据增强的过程。一般来说,缺陷检测分类器是通过包含正常样本(负数据)和带有缺陷的样本(正数据)的基础数据进行训练的,其中后者的数量始终少于正常样本。因此,最先进的数据增强程序通过将人工制造的缺陷数据叠加到正常样本中来增加数据。这样会导致增强数据超出分布范围,使得分类系统学习到了什么不是正常样本,但并不知道缺陷真正的外观。我们展示了扩散模型可以克服这种情况,提供更真实的分布内缺陷,使得模型可以学习到缺陷的真实外观。我们提出了一种新的数据增强方法,将分布内和分布外的样本混合在一起,称之为In&Out。该方法可以处理两种数据增强设置:i)当没有缺陷可用时(零样本数据增强)和ii)当可用缺陷时,这些缺陷可以是少量(少样本)或大量(全样本)。我们将实验重点放在最具挑战性的基准测试上,即Kolektor表面缺陷数据集2上,定义了弱监督下的新最先进分类AP得分为0.782。代码可在https://github.com/intelligolabs/in_and_out上获得。
- 图表
- 解决问题本文旨在解决工业场景下表面缺陷检测中数据增强过程中存在的问题,即合成的缺陷数据不够真实。这是否是一个新问题?
- 关键思路本文提出了一种基于扩散模型的数据增强方法,可以生成更真实的缺陷数据,从而提高模型的检测能力。该方法将合成的缺陷数据与真实的缺陷数据混合使用,可以在缺乏真实缺陷数据时使用,也可以在有真实缺陷数据时使用。
- 其它亮点本文在Kolektor Surface-Defect Dataset 2数据集上进行了实验,取得了新的最优结果。代码已经开源。
- 最近的相关研究包括使用对抗生成网络进行数据增强,以及使用自监督学习进行缺陷检测等。
沙发等你来抢
去评论
评论
沙发等你来抢