- 简介本文介绍了一个名为Constellation的数据集,包含13K张适合用于研究从高空摄像头观察到的密集城市街景中对象检测的图像,这些图像在各种时间条件下采集。该数据集解决了探索小物体检测问题所需的筛选数据的需求,例如从高空观察到的行人的有限像素足迹。它使得可以测试对象检测模型对于光照、建筑物阴影、天气和场景动态变化的变化的适应能力。我们在该数据集上评估了当代对象检测架构,发现最先进的方法在检测小行人方面的性能比车辆低,平均精度(AP)相差10%。使用结构相似的数据集对模型进行预训练可以提高1.8%的平均AP(mAP)。我们还发现,将领域特定的数据增强纳入模型可以提高其性能。使用伪标记数据可以改善模型的性能。最后,比较使用两个不同时间间隔收集的数据训练的模型,我们发现由于时间推移而导致模型性能漂移。最佳模型在NVIDIA A100 GPU上的推理时间为11.5毫秒,行人AP为92.0%,mAP为95.4%。
- 图表
- 解决问题本文旨在提供一个针对高海拔摄像机观察下密集城市街景中物体检测的数据集,并探索小目标检测问题,以及在不同的光照、建筑阴影、天气和场景动态下测试物体检测模型的需求。
- 关键思路本文提出了一个数据集,用于解决密集城市街景中小目标检测的问题,并测试了当代物体检测架构在该数据集上的性能。同时,本文还探究了使用结构相似的数据集进行预训练,以及使用领域特定的数据增强方法来提高模型性能的方法。
- 其它亮点本文提供了一个新的数据集Constellation,用于研究高海拔摄像机观察下密集城市街景中物体检测的问题。作者测试了当代物体检测架构在该数据集上的性能,并发现这些方法在检测小行人方面的性能较差。作者还探究了使用结构相似的数据集进行预训练,以及使用领域特定的数据增强方法来提高模型性能的方法。作者还使用伪标记数据来改进模型性能,并比较了在不同时间间隔内收集的数据集训练的模型性能。
- 最近在该领域中的相关研究包括:1. "Deep Multi-Scale Detection Networks for Large-Scale Landmark Retrieval";2. "Object Detection in 20 Years: A Survey";3. "Pedestrian Detection: A Review"。
沙发等你来抢
去评论
评论
沙发等你来抢