【标题】Object-Category Aware Reinforcement Learning
【作者团队】Qi Yi, Rui Zhang, Shaohui Peng
【发表日期】2022.10.13
【论文链接】https://arxiv.org/pdf/2210.07802.pdf
【推荐理由】与标准强化学习相比,面向对象强化学习(OORL)是提高样本效率和泛化能力的有效途径。最近的工作试图在没有附加特征工程的情况下解决OORL任务,主要集中在学习对象表示,然后根据这些对象表示通过推理解决任务。然而,这些作品都没有试图明确建模同一类别的不同对象实例之间的固有相似性。同一类别的对象应具有相似的功能;因此,类别是对象最关键的属性。本文提出了一个名为对象类别感知强化学习(OCARL)的新框架,它利用对象的类别信息来促进感知和推理。OCARL由三部分组成:(1)类别感知无监督对象发现(UOD),它发现对象及其对应的类别;(2) 对象类别感知感知,对类别信息进行编码,同时对(1)的不完整性具有鲁棒性;(3) 以对象为中心的模块化推理,在基于对象进行推理时,采用多个独立的、对象类别特定的网络。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢