- 简介工业异常检测是计算机视觉中的重要任务,具有广泛的实际应用。许多真实世界数据集中异常区域的尺寸很小,因此需要以高分辨率处理图像。这常常会在模型的训练和推断阶段中带来显著的内存消耗挑战,使得一些现有方法无法被广泛采用。为了克服这个挑战,我们提出了平铺集成方法,通过将输入图像划分为网格状的瓦片,并为每个瓦片位置训练一个专用模型来减少内存消耗。平铺集成与任何现有的异常检测模型兼容,无需修改底层架构。通过引入重叠瓦片,我们利用传统堆叠集成的优势,从而在高分辨率之外进一步提高异常检测能力。我们在两个标准的异常检测数据集MVTec和VisA上使用多种底层架构进行全面分析,包括Padim、PatchCore、FastFlow和Reverse Distillation。我们的方法在各种设置下都表现出显著的改进,同时保持在GPU内存限制范围内,仅消耗与单个模型处理单个瓦片所需的GPU内存相同的内存。
- 图表
- 解决问题本文解决的问题是在工业应用中进行异常检测时,由于异常区域通常很小,需要在高分辨率下处理图像,这会导致模型训练和推理阶段的内存消耗过大,现有方法不太适合广泛采用。因此,本文提出了一种分瓦集成方法,将输入图像划分为网格瓦片,并为每个瓦片位置训练一个专用模型,以减少内存消耗。
- 关键思路本文提出了一种分瓦集成方法,将输入图像划分为网格瓦片,并为每个瓦片位置训练一个专用模型,以减少内存消耗,同时利用传统堆叠集成的优势,通过引入重叠瓦片,实现了比高分辨率更好的异常检测性能。
- 其它亮点本文的亮点包括:1.提出了一种分瓦集成方法,可以降低内存消耗,同时不需要对底层架构进行任何修改;2.使用多种不同的基础架构在MVTec和VisA两个标准异常检测数据集上进行了综合分析;3.通过引入重叠瓦片,实现了比高分辨率更好的异常检测性能;4.本文的方法在GPU内存限制下运行,每个模型只需要处理一个瓦片所需的GPU内存。
- 在工业异常检测领域,近期的相关研究包括:1.《PatchCore: Self-Supervised Denoising via Local and Global Contrasts》;2.《FastFlow: Exploiting Multi-Scale Neighborhood Features for Real-Time Anomaly Detection in Surveillance Videos》;3.《Reverse Distillation: Learning to Learn from Backward Information》等。
沙发等你来抢
去评论
评论
沙发等你来抢