LTGC: Long-tail Recognition via Leveraging LLMs-driven Generated Content

向作者提问

NEW

简介

长尾识别具有挑战性，因为它要求模型学习好的尾部类别表示，并解决所有类别的不平衡问题。本文提出了一种新颖的生成和微调框架LTGC，通过利用生成的内容来处理长尾识别。首先，受大规模模型中丰富的隐式知识（例如大型语言模型，LLM）的启发，LTGC利用这些模型的能力来解析和推理原始的尾部数据，以生成多样的尾部类别内容。然后，我们提出了几种新颖的LTGC设计，以确保生成数据的质量，并使用生成和原始数据高效微调模型。可视化展示了LTGC中生成模块的有效性，它能够产生准确而多样的尾部数据。此外，实验结果表明，我们的LTGC在流行的长尾基准测试中优于现有的最先进方法。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在解决长尾识别中的问题，即如何从尾部类别中学习好的表示，并处理所有类别的不平衡。同时，本文尝试通过利用生成内容来处理长尾识别。
关键思路

本文提出了一种新颖的生成和微调框架LTGC，通过生成数据来处理长尾识别。首先，利用大规模模型中的丰富隐含知识（例如大型语言模型）来分析原始尾部数据并产生多样的尾部类别内容。然后，本文提出了几种新颖的LTGC设计，以确保生成数据的质量，并使用生成数据和原始数据来高效微调模型。
其它亮点

本文的亮点在于利用大型模型生成多样化的尾部数据，以及提出了一种新的生成和微调框架来处理长尾识别。实验结果表明，LTGC在流行的长尾基准测试中优于现有的最先进方法。
相关研究

最近的相关研究包括Long-tail Recognition: A Survey、Learning to Learn from Imbalanced Data和Long-Tail Learning via Logit Adjustment等论文。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问