DeepMind和多伦多大学推出DreamerV3 ,引起关注。

DreamerV3 是第一个在没有人工数据或课程的情况下,从头开始在 Minecraft 中收集钻石的算法,解决了人工智能领域长期存在的挑战。它无需调整就能学习掌握许多领域,这使得强化学习具有广泛的应用前景。

论文地址:https://arxiv.org/abs/2301.04104

作者:D Hafner, J Pasukonis, J Ba, T Lillicrap [DeepMind & University of Toronto]


作为一种基于世界模型的通用算法,DreamerV3 可以在使用固定超参数的情况下学习掌握多种个领域,使强化学习易于应用,DreamerV3 证明了有利于扩展性,即模型尺寸的增加会导致最终性能和数据效率单调提高。

经过广泛的评估表明,DreamerV3 在各领域都优于其他专用算法,DreamerV3 是第一个在没有人工数据或课程的情况下,从头开始在 Minecraft 中收集钻石的算法,解决了人工智能领域长期存在的挑战。

 

 

 

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除