- 简介在现实世界的对话中,贴纸的多样性和歧义性常常会因上下文而导致不同的解释,需要全面理解贴纸并支持多标记。为了解决这个挑战,我们介绍了StickerTAG,这是第一个多标记贴纸数据集,包括一个收集的标记集,共461个标记和13,571个贴纸-标记对,旨在提供对贴纸的更深入理解。由于贴纸标记通常是细粒度的属性感知,因此为贴纸识别多个标记变得特别具有挑战性。因此,我们提出了一种关注属性的提示学习方法,即Att$^2$PL,以细粒度的方式捕捉贴纸的信息特征,以更好地区分标记。具体来说,我们首先应用属性导向描述生成(ADG)模块从四个属性中获取贴纸的描述。然后,设计了一个局部重新关注(LoR)模块来感知局部信息的重要性。最后,我们使用提示学习来引导识别过程,并采用置信度惩罚优化来惩罚置信度输出分布。大量实验表明,我们的方法在所有常用指标上都取得了令人鼓舞的结果。
- 图表
- 解决问题论文旨在解决贴纸理解中的多标签识别问题,提出了一个新的数据集StickerTAG和一种Att^2PL方法。
- 关键思路论文提出了一种基于注意力机制和属性导向的提示学习方法,用于更好地区分贴纸的标签。
- 其它亮点论文提出了一个新的多标签贴纸数据集StickerTAG,包含13,571个贴纸-标签对和461个标签。实验结果表明,Att^2PL方法在所有常用指标上都取得了鼓舞人心的结果。
- 最近的相关研究主要集中在多标签识别方面,例如Multi-label Classification with Deep Learning等。
沙发等你来抢
去评论
评论
沙发等你来抢