标题:Meta|Open Vocabulary Extreme Classification Using Generative Models(使用生成模型的开放词汇极端分类)
作者:Daniel Simig, Fabio Petroni, Majid Yazdani等
简介:本文介绍了一种极端多标签分类 (XMC)任务,旨在标记超大标签集的子集标记。标签词汇表通常是提前定义的由领域专家和假定捕获所有必要的标记。然而,在现实世界中,这个标签集虽然很大,但往往是不完整的,专家经常需要改进它。为了开发简化此过程的系统,作者引入了开放词汇表XMC(OXMC)的任务:给定一段内容,预测一组标签,其中一些可能位于已知标记集之外。因此,在除了没有某些人的训练数据标签,就像零次分类中的情况一样,模型需要即时发明一些标签。作者提出GROOV,一个微调的端到端OXMC的模型,该模型将标签集生成为平面序列,并使用独立于预测标签顺序的新型损失。作者展示了该方法的有效性,试验流行的XMC数据集GROOV能够在给定词汇表之外预测有意义的标签,同时对于已知标签与最先进的解决方案相媲美。
论文下载:https://arxiv.org/pdf/2205.05812v1.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢