AD4RL: Autonomous Driving Benchmarks for Offline Reinforcement Learning with Value-based Dataset

2024年04月03日
  • 简介
    离线强化学习通过使用预先收集的大型数据集提高其实用性,已成为一项有前途的技术。尽管具有实用优势,但大多数离线强化学习算法开发研究仍依赖于使用合成数据集的游戏任务。为了解决这些限制,本文提供了自动驾驶数据集和基准,用于离线强化学习研究。我们提供了19个数据集,包括真实世界中人类驾驶员的数据集,以及三个现实驾驶场景中的七种流行的离线强化学习算法。我们还提供了一个统一的决策过程模型,可以在不同的场景下有效地运作,作为算法设计的参考框架。我们的研究为社区进一步探索现有强化学习方法的实用方面奠定了基础。数据集和代码可在https://sites.google.com/view/ad4rl中找到。
  • 图表
  • 解决问题
    为离线强化学习提供实际应用场景下的数据集和基准测试,解决当前该领域缺乏真实数据集的问题。
  • 关键思路
    提供19个数据集,包括真实的人类驾驶员数据,以及在三种实际驾驶场景下的七种常用离线强化学习算法。同时提供一个统一的决策模型,可跨越不同场景有效运作。
  • 其它亮点
    论文提供了实际应用场景下的数据集和基准测试,为离线强化学习的实际应用提供了支持。同时提供了一个统一的决策模型,为算法设计提供了参考。研究使用的数据集和代码已经开源,方便其他研究者进行进一步研究。
  • 相关研究
    相关研究包括使用合成数据集的离线强化学习算法研究,以及其他实际应用场景下的数据集和基准测试的研究。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论