Faster and Smaller Solutions of Obliging Games

简介

本文介绍了顺从博弈在反应综合的游戏视角中的应用，以促进被合成系统和环境之间的合作。以往的顺从博弈分析方法是小步骤的，因为它们是基于将顺从博弈简化为标准（非顺从）博弈，其中单个移动对应于原始（顺从）博弈中的单个移动。在本文中，我们提出了一种新的大步骤视角，将顺从博弈简化为标准博弈，其中单个移动编码原始博弈中的长期行为。这不仅允许我们给出环境在顺从博弈中获胜的有意义的定义，而且还导致对顺从博弈的策略大小和解决方案运行时间的显着改进。
图表
解决问题

提出了一种新的大步视角的obliging game分析方法，以解决合成系统和环境之间的合作问题。
关键思路

将obliging game转化为标准游戏，以单个动作编码原始游戏中的长期行为，从而提高了策略大小和解决方案运行时间的界限。
其它亮点

该方法提供了一个有意义的定义环境在obliging game中的胜利，并显著提高了策略大小和解决方案运行时间的界限。
相关研究

先前的obliging game分析方法基于小步骤，而这篇论文提出了一种新的大步骤视角。