【论文标题】Dynamic allocation of limited memory resources in reinforcement learning 【作者团队】Nisheet Patel, Luigi Acerbi, Alexandre Pouget 【发表时间】2020/11/12 【论文链接】https://proceedings.neurips.cc//paper/2020/file/c4fac8fb3c9e17a2f4553a001f631975-Paper.pdf 【论文代码】https://github.com/nisheetpatel/DynamicResourceAllocator 【推荐理由】本文收录于NeurIPS 2020,来自日内瓦大学的研究人员研究强化学习与神经科学两个方面,提出了动态框架来对资源进行分配。 生物大脑固有的处理和存储信息的能力受到限制,但是仍然能够轻松地解决复杂的任务。在本文中,研究人员提出了动态资源分配器(DRA),将其应用于强化学习中的两个标准任务和一个基于模型的计划任务,发现它将更多资源分配给对内存有更高影响的项目。此外,DRA从更高的资源预算开始学习时比为更好地完成任务而分配的学习速度要快,这可以解释为什么生物大脑的额叶皮层区域在适应较低的渐近活动水平之前似乎更多地参与了学习的早期阶段。本文的工作为学习如何将昂贵的资源分配给不确定的内存集合以适应环境变化的方式提供了一个规范性的解决方案。

内容中包含的图片若涉及版权问题,请及时与我们联系删除