- 简介本文介绍了顺从博弈在反应综合的游戏视角中的应用,以促进被合成系统和环境之间的合作。以往的顺从博弈分析方法是小步骤的,因为它们是基于将顺从博弈简化为标准(非顺从)博弈,其中单个移动对应于原始(顺从)博弈中的单个移动。在本文中,我们提出了一种新的大步骤视角,将顺从博弈简化为标准博弈,其中单个移动编码原始博弈中的长期行为。这不仅允许我们给出环境在顺从博弈中获胜的有意义的定义,而且还导致对顺从博弈的策略大小和解决方案运行时间的显着改进。
- 图表
- 解决问题提出了一种新的大步视角的obliging game分析方法,以解决合成系统和环境之间的合作问题。
- 关键思路将obliging game转化为标准游戏,以单个动作编码原始游戏中的长期行为,从而提高了策略大小和解决方案运行时间的界限。
- 其它亮点该方法提供了一个有意义的定义环境在obliging game中的胜利,并显著提高了策略大小和解决方案运行时间的界限。
- 先前的obliging game分析方法基于小步骤,而这篇论文提出了一种新的大步骤视角。
沙发等你来抢
去评论
评论
沙发等你来抢