- 简介在现实世界的对话中,贴纸的多样性和歧义性常常会因上下文的不同而导致不同的解释,这需要全面理解贴纸并支持多标记的要求。为了解决这个挑战,我们介绍了StickerTAG,这是第一个包含收集的标记集合(共461个标记)和13,571个贴纸-标记对的多标记贴纸数据集,旨在提供更深入的贴纸理解。由于贴纸标记通常是细粒度属性感知的,因此为贴纸识别多个标记变得特别具有挑战性。因此,我们提出了一种注意力属性导向提示学习方法,即Att$^2$PL,以细粒度的方式捕捉贴纸的信息特征,更好地区分标记。具体而言,我们首先应用属性导向描述生成(ADG)模块从四个属性中获取贴纸的描述。然后,设计了一个局部重新关注(LoR)模块来感知局部信息的重要性。最后,我们使用提示学习来引导识别过程,并采用置信度惩罚优化来惩罚置信输出分布。广泛的实验表明,我们的方法对于所有常用指标都取得了令人鼓舞的结果。
- 图表
- 解决问题本论文旨在解决贴纸标签多重性和多义性带来的挑战,提出了一个包含461个标签和13,571个贴纸-标签对的多标签贴纸数据集StickerTAG,并提出了一种Att^2PL方法来捕捉贴纸的信息特征,以更好地区分标签。
- 关键思路Att^2PL方法包括Attribute-oriented Description Generation模块、Local Re-attention模块和prompt learning,通过fine-grained的方式捕捉贴纸的信息特征,以更好地识别多标签贴纸。
- 其它亮点论文使用了一个新的多标签贴纸数据集StickerTAG,并提出了一种Att^2PL方法,相比当前领域的研究有创新性。实验结果表明,该方法在所有常用指标上均取得了令人鼓舞的结果。
- 在这个领域中,最近还有一些相关的研究,如《Multi-Label Learning with Millions of Labels: Recommending Advertiser Bid Phrases for Web Pages》和《A Survey on Multi-Label Learning》等。
沙发等你来抢
去评论
评论
沙发等你来抢