悉尼大学、商汤等 | 基于Transformer的激光雷达3D目标检测

本文要讲解的论文是几家大学还有商汤一起合作的论文，arXiv2020年11月上载。

论文名称：Temporal-Channel Transformer for 3D Lidar-Based Video Object Detection in Autonomous Driving

定义为Temporal-Channel Transformer，做激光雷达目标检测的时空域和通道域建模。比较特殊的是，这里编码器信息不同于解码器，编码器是多帧时域-通道域编码，解码器是以voxel-wise方式解码当前帧空域信息。Transformer的核心单元是Multihead scaled dot-product attention module。这里Transformer的时域-通道编码器对不同通道和帧的特征相关进行编码，而空域解码器对当前帧的每个位置信息解码。在transformer的gate机制，当前帧特征被重新标定，通过重复修正目标帧表示和上采样过程滤除目标不相干信息。

感兴趣的可以戳链接。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

悉尼大学、商汤等 | 基于Transformer的激光雷达3D目标检测

评论列表

评论