- 简介深度生成回放已经成为决策任务中连续学习的一种有前途的方法。该方法通过利用从先前遇到的任务生成轨迹来增强当前数据集,解决了灾难性遗忘的问题。然而,现有的深度生成回放方法依赖于自回归模型,这些模型在生成的轨迹中存在复合误差。本文提出了一种简单、可扩展且非自回归的方法,利用生成模型在轨迹时间步上生成任务样本,用于决策任务中的连续学习。我们在连续世界基准测试中评估了我们的方法,发现我们的方法在连续学习方法的平均成功率指标上实现了最先进的性能。代码可在 https://github.com/WilliamYue37/t-DGR 上获得。
-
- 图表
- 解决问题解决问题:论文试图解决什么问题,或者验证什么假设?这是否是一个新问题?
- 关键思路关键思路:论文中解决问题的方案关键思路是什么?相比当前这个领域的研究状况,这篇论文的思路有什么新意?
- 其它亮点其他亮点:论文提出了一种简单、可扩展且非自回归的方法来解决决策任务中的持续学习问题,使用生成模型生成基于轨迹时间步的任务样本。在Continual World基准测试中,该方法在持续学习方法的平均成功率指标上实现了最先进的性能。代码可在https://github.com/WilliamYue37/t-DGR上获得。
- 相关研究:最近在这个领域中,还有哪些相关的研究被进行?能否列举一些相关研究的论文标题?
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流