- 简介深度学习模型越来越需要大量数据,需要大量资源来收集和编译训练所需的数据集,地球观测(EO)模型也不例外。然而,EO数据集的景观相对分散,由于格式和数据结构的多样性,互操作性变得困难。如果需要构建更大的数据集并最小化重复劳动,则需要一个共享框架,允许用户组合和访问多个数据集。在这里,提出了Major TOM(陆地观测元集)作为这个可扩展框架。主要包括基于一组网格点的地理索引系统和允许合并不同来源的多个数据集的元数据结构。除了将Major TOM规范作为一个框架之外,这项工作还提供了一个大型的开放数据集MajorTOM-Core,覆盖了地球大部分陆地表面。该数据集不仅为社区提供了一个立即有用的资源,还作为未来增加Major TOM生态系统的模板。访问网址:https://huggingface.co/Major-TOM
- 图表
- 解决问题如何解决地球观测数据集的格式不一、数据结构多样性难以互操作的问题?
- 关键思路提出了一个基于地理索引系统和元数据结构的可扩展框架Major TOM,用于合并和访问多个具有不同来源的数据集。
- 其它亮点论文提供了一个大型开放数据集MajorTOM-Core,涵盖了地球大部分陆地表面。此外,该框架还可以作为模板,帮助未来将更多数据集添加到Major TOM生态系统中。
- 与该领域的相关研究包括:1.《A Comprehensive Review of Deep Learning for Image Captioning》;2.《A Review on Deep Learning Techniques for Image and Video Analysis》;3.《A review of deep learning with special emphasis on architectures, applications and recent trends》。
沙发等你来抢
去评论
评论
沙发等你来抢