【标题】Reinforcement Learning based Recommender Systems: A Survey

【作者团队】M. Mehdi Afsar, Trafford Crump, Behrouz Far

【发表日期】2022.6.15

【论文链接】https://dl.acm.org/doi/pdf/10.1145/3543846

【推荐理由】推荐系统 (RS) 已成为日常生活中不可分割的一部分。传统上,推荐问题被认为是分类或预测问题,但现在人们普遍认为,将其表述为顺序决策问题可以更好地反映用户-系统交互。因此,它可以表述为马尔可夫决策过程(MDP)并通过强化学习(RL)算法来解决。与传统的推荐方法(包括协同过滤和基于内容的过滤)不同,RL 能够处理顺序的、动态的用户系统交互,并考虑到长期的用户参与。本文介绍了基于强化学习的推荐系统 (RLRS) 的研究。首先认识到并说明 RLRS 通常可以分为基于 RL 和 DRL 的方法。然后,提出了一个包含四个部分的 RLRS 框架,即状态表示、策略优化、奖励制定和环境建设,并相应地综述 RLRS 算法。本文使用各种图表突出新兴主题并描绘重要趋势。最后,讨论了未来可以解决的重要方面和挑战。

内容中包含的图片若涉及版权问题,请及时与我们联系删除