【标题】Dynamic distributed constraint optimization using multi-agent reinforcement learning
【作者团队】Maryam Shokoohi, Mohsen Afsharchi, Hamed Shah-Hoseini
【发表日期】 2022.03.16
【论文链接】https://link.springer.com/content/pdf/10.1007/s00500-022-06820-7.pdf
【推荐理由】动态分布式约束优化问题(动态 DCOP)的一个固有困难是在当前时间进行分配时未来事件的不确定性。这种依赖性在研究界没有得到很好的解决。本文提出了一种基于强化学习的动态分布式约束优化求解器。本文表明,强化学习技术是随着时间的推移解决给定问题的一种替代方法,并且在计算上比顺序 DCOP 求解器更有效。本文还使用新的启发式方法来获得正确的结果,并描述了一种形式主义,该形式主义已被用于对具有协作智能体的动态 DCOP 进行建模。本文通过实验结果在动态武器目标分配(动态 WTA)问题中评估了这种方法。本文观察到系统动态 WTA 问题在满足约束条件的同时收敛后仍然是一个安全区域。此外,在实验中已经实现了最终收敛到正确分配的智能体。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢