【作者团队】Sabela Ramos, Sertan Girgin, Léonard Hussenot

【论文链接】https://openreview.net/pdf?id=uce6UK2fW4O

【推荐理由】本文介绍了 RLDS(强化学习数据集),这是一个生态系统,用于在包括强化学习(RL)、从演示中学习、离线 RL 或模仿学习在内的顺序决策(SDM)环境中记录、重放、操作、注释和共享数据。RLDS 不仅可以重现现有研究并轻松生成新数据集,还可以加速新研究。通过提供标准和无损格式的数据集,它可以在更广泛的任务中快速测试新算法。RLDS 生态系统可以轻松共享数据集,而不会丢失任何信息,并且在将各种数据处理传递途径应用于大型数据集集合时,无需了解底层原始格式。此外,RLDS 提供了用于收集合成智能体或人类生成的数据的工具,以及检查和处理收集到的数据。最终,与 TFDS 的集成有助于与研究社区共享 RL 数据集。

内容中包含的图片若涉及版权问题,请及时与我们联系删除