Transformers开始在视频识别领域的“猪突猛进”,各种改进和魔改层出不穷。由此作者将开启Video Transformer系列的讲解,本篇主要介绍了FBAI团队的TimeSformer,这也是第一篇使用纯Transformer结构在视频识别上的文章。

paper:  https://arxiv.org/abs/2102.05095

code(offical):  https://github.com/facebookresearch/TimeSformer

accept: ICML2021

author: Facebook AI

内容中包含的图片若涉及版权问题,请及时与我们联系删除