IPAD: Industrial Process Anomaly Detection Dataset

2024年04月23日
  • 简介
    视频异常检测(VAD)是一个具有挑战性的任务,旨在识别视频帧中的异常情况。现有的大规模VAD研究主要集中在道路交通和人类活动场景上。在工业场景中,常常存在各种不可预测的异常情况,而VAD方法可以在这些场景中发挥重要作用。然而,由于隐私和安全问题,缺乏专门针对工业生产场景的适用数据集和方法。为了弥补这一差距,我们提出了一个新的数据集IPAD,专门设计用于工业场景中的VAD。我们的数据集选择了现场工厂研究和与工程师讨论中的工业过程。该数据集涵盖了16种不同的工业设备,并包含超过6小时的合成和真实世界视频素材。此外,我们注释了工业过程的关键特征,即周期性。基于所提出的数据集,我们引入了一个周期性记忆模块和一个滑动窗口检查机制,以有效地调查基本重建模型中的周期性信息。我们的框架利用LoRA适配器探索预训练模型的有效迁移,这些模型最初使用合成数据进行训练,然后迁移到真实世界场景中。我们提出的数据集和方法将填补工业视频异常检测领域的空白,并推动视频理解任务和智能工厂部署的进程。
  • 图表
  • 解决问题
    本文旨在解决工业场景下视频异常检测的问题,由于涉及隐私和安全问题,目前缺乏适用于工业生产场景的数据集和方法。
  • 关键思路
    为此,本文提出了一个新的数据集IPAD,该数据集专门设计用于工业场景下的视频异常检测,并使用周期性标注关键工业过程特征。同时,本文引入了周期记忆模块和滑动窗口检查机制来有效地研究基本重建模型中的周期信息。本文还使用LoRA适配器,探索预训练模型的有效迁移,这些模型最初是使用合成数据进行训练的,以适应真实世界的场景。
  • 其它亮点
    该数据集包含16种不同的工业设备,并包含超过6小时的合成和真实世界视频镜头。实验结果表明,该方法在IPAD数据集上取得了很好的性能。该研究的亮点包括:新的数据集IPAD,引入了周期记忆模块和滑动窗口检查机制,使用LoRA适配器进行预训练模型的有效迁移。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,例如:《VAD-CNN: A Deep Learning Approach for Video Anomaly Detection in Crowded Scenes》、《Robust Video Anomaly Detection via Deep Multi-scale Spatio-temporal Aggregation》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论