本文要讲解的论文是几家大学还有商汤一起合作的论文,arXiv2020年11月上载。
- 论文名称:Temporal-Channel Transformer for 3D Lidar-Based Video Object Detection in Autonomous Driving
定义为Temporal-Channel Transformer,做激光雷达目标检测的时空域和通道域建模。比较特殊的是,这里编码器信息不同于解码器,编码器是多帧时域-通道域编码,解码器是以voxel-wise方式解码当前帧空域信息。Transformer的核心单元是Multihead scaled dot-product attention module。这里Transformer的时域-通道编码器对不同通道和帧的特征相关进行编码,而空域解码器对当前帧的每个位置信息解码。在transformer的gate机制,当前帧特征被重新标定,通过重复修正目标帧表示和上采样过程滤除目标不相干信息。
感兴趣的可以戳链接。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢