【作者团队】Ramírez, Jorge, Yu, Wen, Perrusquía
【论文链接】https://link.springer.com/content/pdf/10.1007/s10462-021-10085-1.pdf
【推荐理由】来自专家演示的强化学习 (RLED) 是模仿学习与强化学习的交叉点,综合利用这两种学习方法。 RLED 使用演示轨迹来提高高维空间中的样本效率。 通过利用专家的演示,RLED 是一种新的有前途的行为学习方法。 RLED 考虑了两种可能的知识来源来指导强化学习过程:先验知识和在线知识。 这项研究侧重于通过不一定由人类提供的演示来引导的无模型强化学习的新方法。 根据示范的影响对这些方法进行分析和分类。 还讨论了改进方法的挑战、应用和前景。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢