【论文标题】Towards General Purpose Vision Systems
【作者团队】T Gupta, A Kamath, A Kembhavi, D Hoiem
【发表时间】2021/04/01
【机 构】Allen Institute for AI & UIUC
【论文链接】https://arxiv.org/pdf/2104.00743.pdf
【推荐理由】本文来自Allen AI 和 UIUC,文章研究并设计了一个与任务无关的通用视觉系统GPV-I。
本文提出的任务无关的视觉语言系统GPV-I,接受图像和自然语言任务描述,输出边框、置信和文本,支持广泛的视觉任务,如分类、定位、问答、自动描述等。这种通用性并不以牺牲准确度为代价,GPV-I在训练单个任务时,与专项系统相比表现良好,而在联合训练时,则表现优异。与专项系统相比,主要代价是运行时间效率。GPV-I还实现了一定的技能概念泛化,学习速度更快,遗忘速度更慢。评估了系统同时学习多种技能的能力,执行新的技能概念组合任务的能力,以及高效学习新技能而不会遗忘的能力。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢