Faster and Smaller Solutions of Obliging Games

2024年07月16日
  • 简介
    本文介绍了顺从博弈在反应综合的游戏视角中的应用,以促进被合成系统和环境之间的合作。以往的顺从博弈分析方法是小步骤的,因为它们是基于将顺从博弈简化为标准(非顺从)博弈,其中单个移动对应于原始(顺从)博弈中的单个移动。在本文中,我们提出了一种新的大步骤视角,将顺从博弈简化为标准博弈,其中单个移动编码原始博弈中的长期行为。这不仅允许我们给出环境在顺从博弈中获胜的有意义的定义,而且还导致对顺从博弈的策略大小和解决方案运行时间的显着改进。
  • 图表
  • 解决问题
    提出了一种新的大步视角的obliging game分析方法,以解决合成系统和环境之间的合作问题。
  • 关键思路
    将obliging game转化为标准游戏,以单个动作编码原始游戏中的长期行为,从而提高了策略大小和解决方案运行时间的界限。
  • 其它亮点
    该方法提供了一个有意义的定义环境在obliging game中的胜利,并显著提高了策略大小和解决方案运行时间的界限。
  • 相关研究
    先前的obliging game分析方法基于小步骤,而这篇论文提出了一种新的大步骤视角。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论