Adaptive Slot Attention: Object Discovery with Dynamic Slot Number

简介

Object-centric learning（OCL）通过使用槽位提取对象的表示，为抽象低级感知特征提供了出色的灵活性和可解释性。在OCL中广泛采用的方法是槽位注意力，它利用注意机制迭代地细化槽位表示。然而，大多数基于对象的模型，包括槽位注意力，最大的缺点是它们依赖于预定义的槽数量。这不仅需要对数据集有先验知识，而且忽略了每个实例中存在的对象数量的内在变异性。为了克服这个根本限制，我们提出了一种新颖的复杂度感知的对象自编码器框架。在这个框架中，我们引入了一种自适应槽位注意力（AdaSlot）机制，根据数据内容动态确定最优的槽数量。这是通过提出一个离散的槽位采样模块来实现的，该模块负责从候选列表中选择适当数量的槽位。此外，我们引入了一个掩蔽槽位解码器，在解码过程中抑制未选定的槽位。我们的框架在各种数据集的对象发现任务中进行了广泛的测试，表现与顶级固定槽位模型相当或超过。此外，我们的分析证明了我们的方法展现了根据每个实例的复杂性动态适应槽位数量的能力，为槽位注意力研究提供了进一步的探索潜力。该项目将在https://kfan21.github.io/AdaSlot/上提供。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文试图解决大多数物体中心模型的一个根本限制，即依赖于预定义的槽位数。这不仅需要先前对数据集的了解，而且忽略了每个实例中存在的物体数量的固有变异性。
关键思路

论文提出了一种新的复杂度感知物体自编码器框架，其中引入了一种自适应槽位注意机制（AdaSlot），它根据数据内容动态确定最佳槽位数。
其它亮点

该框架在各种数据集上进行了广泛测试，表现与顶级固定槽位模型相当或超过。此外，作者的分析证明了该方法具有根据每个实例的复杂性动态适应槽位数的能力，为槽位注意力研究提供了进一步的探索。
相关研究

最近在这个领域中，还有一些相关研究，例如《Slot Attention》、《Object-Centric Learning with Slot Attention》等。

Adaptive Slot Attention: Object Discovery with Dynamic Slot Number

提问交流

提问交流