本文通过将可视化转换器模型分类到不同的任务中,并分析这些方法的优缺点,来提供对这些模型的文献综述。主要类别包括基本图像分类、高级视觉、低级视觉和视频处理。并对计算机视觉中的自我注意进行了简要回顾,最后,对视觉Transformer的进一步研究方向进行了讨论。

论文:A Survey on Visual Transformer 链接:https://arxiv.org/abs/2012.12556 作者:坐化@知乎 来源:https://zhuanlan.zhihu.com/p/342114940 转载:https://mp.weixin.qq.com/s/hZBldI-gbkc0WocdCsYL5Q

内容中包含的图片若涉及版权问题,请及时与我们联系删除