ReCon1M:A Large-scale Benchmark Dataset for Relation Comprehension in Remote Sensing Imagery

2024年06月10日
  • 简介
    场景图生成(SGG)是一项旨在从图像中提取实体(如物体)及其相互关系的高级视觉理解和推理任务。近年来,在自然图像的SGG研究方面已经取得了显著进展,但在遥感图像领域的探索仍非常有限。遥感图像的复杂特征需要比自然图像更高的时间和手动解释成本来进行注释。缺乏大规模的公共SGG基准是遥感影像中SGG相关研究进展的主要障碍。本文介绍了遥感图像领域中第一个公开可用的大规模、百万级关系数据集ReCon1M。具体而言,我们的数据集建立在Fair1M的基础上,包括21,392张图像的注释,涵盖60个不同类别的859,751个物体边界框和基于这些边界框的64个类别的1,149,342个关系三元组。我们提供了数据集特征和统计信息的详细描述。我们在该数据集上进行了两个目标检测任务和三个SGG子任务,评估了主流方法在这些任务上的性能。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在解决遥感图像中的场景图生成问题,即从图像中提取实体(如物体)和它们之间的关系。由于遥感图像的复杂特征,手动标注的时间和成本比自然图像更高,缺乏大规模的公共场景图生成基准数据集。
  • 关键思路
    本文提出了第一个公共的大规模遥感图像场景图数据集ReCon1M,包括21,392张图像,859,751个物体边界框和1,149,342个基于这些边界框的关系三元组。在此数据集上进行了两个物体检测任务和三个场景图生成子任务,并评估了主流方法在这些任务上的性能。
  • 其它亮点
    本文的亮点包括提出了新的遥感图像场景图数据集ReCon1M,该数据集包括大量物体边界框和关系三元组,可用于场景图生成任务的研究;在数据集上进行了两个物体检测任务和三个场景图生成子任务的实验,并评估了主流方法在这些任务上的性能。
  • 相关研究
    近年来,在自然图像中的场景图生成方面取得了显著进展,但在遥感图像领域的研究仍非常有限。目前还没有大规模的公共遥感图像场景图数据集。相关研究包括:《Scene Graph Generation with External Knowledge and Image Reconstruction》、《Scene graph generation with iterative message passing》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问