- 简介长尾识别具有挑战性,因为它要求模型学习好的尾部类别表示,并解决所有类别的不平衡问题。本文提出了一种新颖的生成和微调框架LTGC,通过利用生成的内容来处理长尾识别。首先,受大规模模型中丰富的隐式知识(例如大型语言模型,LLM)的启发,LTGC利用这些模型的能力来解析和推理原始的尾部数据,以生成多样的尾部类别内容。然后,我们提出了几种新颖的LTGC设计,以确保生成数据的质量,并使用生成和原始数据高效微调模型。可视化展示了LTGC中生成模块的有效性,它能够产生准确而多样的尾部数据。此外,实验结果表明,我们的LTGC在流行的长尾基准测试中优于现有的最先进方法。
-
- 图表
- 解决问题本文旨在解决长尾识别中的问题,即如何从尾部类别中学习好的表示,并处理所有类别的不平衡。同时,本文尝试通过利用生成内容来处理长尾识别。
- 关键思路本文提出了一种新颖的生成和微调框架LTGC,通过生成数据来处理长尾识别。首先,利用大规模模型中的丰富隐含知识(例如大型语言模型)来分析原始尾部数据并产生多样的尾部类别内容。然后,本文提出了几种新颖的LTGC设计,以确保生成数据的质量,并使用生成数据和原始数据来高效微调模型。
- 其它亮点本文的亮点在于利用大型模型生成多样化的尾部数据,以及提出了一种新的生成和微调框架来处理长尾识别。实验结果表明,LTGC在流行的长尾基准测试中优于现有的最先进方法。
- 最近的相关研究包括Long-tail Recognition: A Survey、Learning to Learn from Imbalanced Data和Long-Tail Learning via Logit Adjustment等论文。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流