即插即用 | 通过自适应聚类Transformer来提升DERT目标检测器的速度

DERT中使用Transformer进行端到端目标检测，并实现与Faster-RCNN等两阶段目标检测可比的性能。但是，由于高分辨率的图像输入，DETR需要大量的计算资源来进行训练和推理。为了降低高分辨率输入的计算成本，本文提出了一种新型的变体，称为自适应聚类Transformer(ACT)。

ACT使用局部敏感哈希(LSH)自适应地对查询特征进行聚类，并使用原型键交互在查询键交互附近进行聚类。ACT可以将自注意力的二次O(N2)复杂度降低到O(NK)，其中K是每层原型的数量。ACT可以是嵌入式模块，无需任何训练即可代替原始的自注意力模块。

感兴趣的可以戳链接。

来源：AI人工智能初学者

内容中包含的图片若涉及版权问题，请及时与我们联系删除