数据驱动是深度学习算法的标志特点之一。自ImageNet开始,从大规模数据中学习深度特征成为了计算机视觉领域的通用做法。研究表明,在ImageNet上面进行预训练可以得到丰富的通用特征,从而支撑下游的诸多2D视觉任务。然而,由于收集真实3D数据的耗时和困难,目前仍缺乏与ImageNet同一规模的3D图像数据集。因此,本文作者通过日常生活中的视频数据,构建了MVImgNet数据集。该数据集包括来自219,188个视频的650万帧,涵盖了238个类别的实体对象及其在目标定位、相机参数、点云等多方面的标注信息。
基于MVImgNet数据集,作者进一步提出了3D点云数据集MVPNet,包含150类共计87200样本。
论文:https://arxiv.org/pdf/2303.06042.pdf
平台:https://gaplab.cuhk.edu.cn/projects/MVImgNet/
重要作者:Xianggang Yu ,..., Xiaoguang Han
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢