【标题】Turning Mathematics Problems into Games: Reinforcement Learning and Gröbner bases together solve Integer Feasibility Problems

【作者团队】Yue Wu, Jesús A. De Loera

【发表日期】2022.8.25

【论文链接】https://arxiv.org/pdf/2208.12191.pdf

【推荐理由】可以通过玩游戏来训练代理人回答困难的数学问题吗?考虑整数可行性问题,这是一个确定线性方程组和不等式组是否具有整数值解的挑战。本文描述了新的代数强化学习框架,解释了如何将整数可行性问题转化为一组具有固定边距和的数组上的博弈。游戏从初始状态(数组)开始,通过应用保持边距不变的合法移动,其目标是最终达到在特定位置为零的获胜状态。关键的代数成分是底层轴向运输多面体复曲面理想的Gröbner。Gröbner基础可以被视为博弈中一组连接动作(动作)。该方法训练智能体预测连续空间中的移动,以应对大尺寸的动作空间。然后将连续移动投影到一组合法移动上,以便路径始终指向有效状态。研究结果表明,其可以很好地玩最简单的双向桌游戏。并通过当代机器学习方法训练代理解决非平凡数学查询的潜力,以用于训练智能体玩游戏。