【论文标题】Reinforcement learning based recommender systems: A survey基于强化学习的推荐系统:综述

【作者团队】M. Mehdi Afsar, Trafford Crump, Behrouz Far,University of Calgary

【发表时间】2021-01-15

【论文链接】https://arxiv.org/abs/2101.06286

【推荐理由】推荐系统(RS)成为我们日常生活中不可分割的一部分。他们帮助我们找到了我们最喜欢的商品,社交网络上的朋友以及我们喜欢的电影。传统上,推荐问题被视为简单的分类或预测问题。但是,已显示推荐问题的顺序性质。因此,可以将其公式化为马尔可夫决策过程(MDP),并可以采用强化学习(RL)方法来解决它。实际上,将深度学习与传统RL方法(即深度强化学习(DRL))相结合的最新进展使得将RL应用于具有大量状态和动作空间的推荐问题成为可能。在本文中,对基于强化学习的推荐系统(RLRS)进行了调查。我们首先认识到为RLRS开发的算法通常可以分为基于RL和DRL的方法。然后,我们基于特定的RL算法(例如Q学习,SARSA和REINFORCE)以分类的方式介绍这些基于RL和DRL的方法,这些方法用于优化推荐策略。此外,还提供了一些表格,其中包含有关这些方法的MDP公式及其评估方案的详细信息。最后,我们讨论了将来可以解决的重要方面和挑战。用于优化推荐政策。此外,还提供了一些表格,其中包含有关这些方法的MDP公式及其评估方案的详细信息。最后,文章讨论了将来可以解决的重要方面和挑战。

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除