全文翻译|华为、北大、悉尼大学：最新视觉Transformer综述（2017-2020年）

本文通过将可视化转换器模型分类到不同的任务中，并分析这些方法的优缺点，来提供对这些模型的文献综述。主要类别包括基本图像分类、高级视觉、低级视觉和视频处理。并对计算机视觉中的自我注意进行了简要回顾，最后，对视觉Transformer的进一步研究方向进行了讨论。

论文：A Survey on Visual Transformer 链接：https://arxiv.org/abs/2012.12556 作者：坐化@知乎来源：https://zhuanlan.zhihu.com/p/342114940 转载：https://mp.weixin.qq.com/s/hZBldI-gbkc0WocdCsYL5Q

内容中包含的图片若涉及版权问题，请及时与我们联系删除