reBEN: Refined BigEarthNet Dataset for Remote Sensing Image Analysis

2024年07月04日
  • 简介
    本文介绍了一种名为reBEN的优化版BigEarthNet数据集,该数据集是一个大规模、多模态的遥感数据集,旨在支持遥感图像分析的深度学习研究。reBEN数据集由549,488对Sentinel-1和Sentinel-2图像补丁组成。为了构建reBEN,我们首先考虑用于构建BigEarthNet数据集的Sentinel-1和Sentinel-2瓦片,然后将它们分成1200m x 1200m的补丁。我们使用最新版本的sen2cor工具对Sentinel-2补丁进行大气校正,相比于BigEarthNet中的补丁,这样可以得到更高质量的补丁。然后,每个补丁都与像素级参考地图和场景级多标签相关联,使得reBEN适用于像素和场景级的学习任务。标签使用最新的CORINE Land Cover (CLC) 2018地图派生,使用与BigEarthNet相同的19类命名法。使用最新的CLC地图可以解决BigEarthNet中存在的标签噪声问题。此外,我们引入了一种新的基于地理位置的分割分配算法,显著降低了训练、验证和测试集之间的空间相关性,以提高DL模型评估的可靠性。为了最小化DL模型的训练时间,我们引入了软件工具,将reBEN数据集转换为DL优化的数据格式。在我们的实验中,我们通过考虑几种最先进的DL模型展示了reBEN在多模态多标签图像分类问题上的潜力。预训练模型权重、相关代码和完整数据集可在https://bigearth.net上获得。
  • 图表
  • 解决问题
    本文旨在构建一个大规模、多模态的遥感数据集,以支持深度学习研究。该数据集可以用于像素级和场景级的学习任务,并且可以克服BigEarthNet数据集中存在的标签噪声和空间相关性问题。
  • 关键思路
    构建了一个由Sentinel-1和Sentinel-2图像补丁对组成的遥感数据集reBEN,使用最新版本的sen2cor工具对Sentinel-2图像进行大气校正,使用最新的CORINE Land Cover(CLC)地图生成标签,采用新的地理分割算法减少了训练、验证和测试集之间的空间相关性。
  • 其它亮点
    实验结果表明,reBEN数据集适用于多模态多标签图像分类问题,并且比BigEarthNet数据集具有更高的质量和可靠性。同时,为了减少DL模型的训练时间,本文还提供了将reBEN数据集转换为DL优化数据格式的软件工具。
  • 相关研究
    最近在这个领域中,还有一些相关研究,例如《BigEarthNet: A Large-Scale Benchmark Archive for Remote Sensing Image Understanding》。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论