MVImgNet 是一个大规模多视角图像数据集,可用于各种3D和2D视觉任务,以及现实世界的3D物体分类。

MVImgNet: A Large-scale Dataset of Multi-view Images

Xianggang Yu, Mutian Xu, Yidan Zhang, Haolin Liu, Chongjie Ye, Yushuang Wu, Zizheng Yan, Chenming Zhu, Zhangyang Xiong, Tianyou Liang, Guanying Chen, Shuguang Cui, Xiaoguang Han
[CUHKSZ]

要点:

  1. MVImgNet 是一个大规模的多视角图像数据集,可作为3D视觉版的 ImageNet,填补了计算机视觉界的一个空白;
  2. MVImgNet 的多视角性质提供了 3D 感知的视觉信号,使其成为连接 2D 和 3D 视觉的软桥梁;
  3. MVImgNet 有丰富的物体蒙版、相机参数和点云的标注,使其能用于各种 3D 和 2D 视觉任务,如辐射场重建、多视立体和视图一致图像理解;
  4. 随 MVImgNet 附带的,有一个名为 MVPNet 的点云数据集,涵盖了150个类别的87200个样本,每个点云上都有类别标签,有利于现实世界的 3D 物体分类。

https://arxiv.org/abs/2303.06042 


图片
图片
图片
图片