Hypersim: A Photorealistic Synthetic Dataset for Holistic Indoor Scene Understanding 论文链接:https://arxiv.org/abs/2011.02523
包含461个室内场景的77,400张图像,并带有每个像素的详细标签和相应的ground-truth几何形状,可用于语义、实例分割、表面法线估计等2D和3D任务。生成该合成数据集的代码即将开源!星球将第一时间推送!作者单位:Apple
对于许多基本的场景理解任务,很难或不可能从真实图像中获得每个像素的ground-truth标签。我们通过引入Hypersim(一种用于整体室内场景理解的逼真的合成数据集)来应对这一挑战。为了创建我们的数据集,我们利用由专业艺术家创建的合成场景的大型存储库,并生成461个室内场景的77,400张图像,并带有每个像素的详细标签和相应的ground-truth几何形状。我们的数据集:(1)仅依靠可公开获得的3D assets; (2)包括每个场景的完整场景几何图形,材质信息和照明信息; (3)包括每个图像的密集的每像素语义实例分割; (4)将每个图像分解为漫反射率,漫射照明和捕获依赖于视图的照明效果的非漫射残差项。这些功能一起使我们的数据集非常适合需要直接3D监督的几何学习问题,需要在多个输入和输出模态上共同进行推理的多任务学习问题以及逆渲染问题。我们在场景,对象和像素级别分析数据集,并在成本,注释工作量和计算时间方面分析成本。值得注意的是,我们发现有可能从头开始生成整个数据集,而花费的时间大约是训练最先进的自然语言处理模型的一半。我们用于生成数据集的所有代码都将在线提供。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢