UnO: Unsupervised Occupancy Fields for Perception and Forecasting

向作者提问

NEW

简介

自动驾驶需要感知世界并预测其未来状态，这是一个关键任务。监督式方法利用带注释的对象标签学习世界模型，传统方法包括对象检测和轨迹预测，或者是时间序列的俯视图（BEV）占用场。然而，这些注释很昂贵，通常只限于一组预定义的类别，不能涵盖我们在路上可能遇到的所有情况。相反，我们学习使用LiDAR数据进行自我监督，感知和预测连续的四维（时空）占用场。这种无监督的世界模型可以轻松有效地转移到下游任务。我们通过添加轻量级的学习渲染器来解决点云预测，并在Argoverse 2、nuScenes和KITTI上实现了最先进的性能。为了进一步展示其可转移性，我们微调我们的模型以进行BEV语义占用预测，并表明它在超级有限标注数据的情况下优于完全监督的最先进方法。最后，与先前的时空几何占用预测最先进方法相比，我们的四维世界模型实现了更高的召回率，尤其是对于与自动驾驶相关的类别的对象。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

如何在自动驾驶中实现对于连续的4D（时空）占据场的感知和预测，而无需昂贵的标注数据？
关键思路

使用自监督学习从LiDAR数据中学习感知和预测连续的4D占据场，利用轻量级的学习渲染器实现点云预测，并在Argoverse 2、nuScenes和KITTI数据集上实现了最先进的性能。
其它亮点

使用自监督学习避免了昂贵的标注数据，同时提出了一种轻量级的学习渲染器。实验结果表明，在BEV语义占据预测方面，该模型优于全监督的最先进方法，特别是在标注数据稀缺的情况下。此外，在时空几何占据预测方面，该模型的召回率比与自动驾驶相关的类别的最先进方法高得多。
相关研究

与该论文相关的研究包括：1.使用卷积神经网络对占据场进行预测的方法；2.使用基于图像的方法对自动驾驶场景进行建模的方法；3.使用点云数据进行自动驾驶场景建模的方法。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问