【标题】Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

【作者团队】Michael Bradley Johanson, Edward Hughes, Finbarr Timbers, Joel Z. Leibo

【发表日期】2022.5.13

【论文链接】https://arxiv.org/pdf/2205.06760.pdf

【推荐理由】人工智能的进步通常源于新环境的发展,新环境将现实世界的情况抽象为一种可以方便地进行研究的形式。本文基于受初级微观经济学启发的想法提供了这样一个环境。智能体学习在空间复杂的世界中生产资源,相互交易,并消费他们喜欢的资源。本文表明,新兴的生产、消费和定价行为会按照微观经济学中供需变化预测的方向对环境条件作出反应。本文还展示了智能体的商品紧急价格随空间变化的环境,反映了当地商品的丰富程度。价差出现后,一些智能体随后发现了在不同现行价格的地区之间运输货物的利基市场——这是一种有利可图的策略,因为他们可以在便宜的地方购买商品,并在价格昂贵的地方出售商品。最后,在实验中,本文研究了环境奖励、易货行动、智能体架构和消费可交易商品的能力如何帮助或抑制这种经济行为的出现。

内容中包含的图片若涉及版权问题,请及时与我们联系删除