Towards Real-World Stickers Use: A New Dataset for Multi-Tag Sticker Recognition

2024年03月08日
  • 简介
    在现实世界的对话中,贴纸的多样性和歧义性常常会因上下文的不同而导致不同的解释,这需要全面理解贴纸并支持多标记的要求。为了解决这个挑战,我们介绍了StickerTAG,这是第一个包含收集的标记集合(共461个标记)和13,571个贴纸-标记对的多标记贴纸数据集,旨在提供更深入的贴纸理解。由于贴纸标记通常是细粒度属性感知的,因此为贴纸识别多个标记变得特别具有挑战性。因此,我们提出了一种注意力属性导向提示学习方法,即Att$^2$PL,以细粒度的方式捕捉贴纸的信息特征,更好地区分标记。具体而言,我们首先应用属性导向描述生成(ADG)模块从四个属性中获取贴纸的描述。然后,设计了一个局部重新关注(LoR)模块来感知局部信息的重要性。最后,我们使用提示学习来引导识别过程,并采用置信度惩罚优化来惩罚置信输出分布。广泛的实验表明,我们的方法对于所有常用指标都取得了令人鼓舞的结果。
  • 图表
  • 解决问题
    本论文旨在解决贴纸标签多重性和多义性带来的挑战,提出了一个包含461个标签和13,571个贴纸-标签对的多标签贴纸数据集StickerTAG,并提出了一种Att^2PL方法来捕捉贴纸的信息特征,以更好地区分标签。
  • 关键思路
    Att^2PL方法包括Attribute-oriented Description Generation模块、Local Re-attention模块和prompt learning,通过fine-grained的方式捕捉贴纸的信息特征,以更好地识别多标签贴纸。
  • 其它亮点
    论文使用了一个新的多标签贴纸数据集StickerTAG,并提出了一种Att^2PL方法,相比当前领域的研究有创新性。实验结果表明,该方法在所有常用指标上均取得了令人鼓舞的结果。
  • 相关研究
    在这个领域中,最近还有一些相关的研究,如《Multi-Label Learning with Millions of Labels: Recommending Advertiser Bid Phrases for Web Pages》和《A Survey on Multi-Label Learning》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论