Simulation-Based Benchmarking of Reinforcement Learning Agents for Personalized Retail Promotions

向作者提问

NEW

简介

开放式基准测试平台的发展可以极大地加速零售业中人工智能代理的采用。本文提供了客户购物行为的全面模拟，以便基准测试强化学习代理的优惠券定向优化。这个学习问题的难度主要是由于客户购买事件的稀疏性所驱动的。我们使用离线批处理数据来训练代理，其中包括总结的客户购买历史，以帮助缓解这种影响。我们的实验表明，上下文赌博机和深度强化学习方法不太容易过度拟合稀疏的奖励分布，显著优于静态策略。这项研究提供了一个实用的框架，用于模拟优化整个零售客户旅程的人工智能代理。它旨在激发进一步开发零售业人工智能系统模拟工具的灵感。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在通过开发开放的基准测试平台，加速AI代理在零售业的应用。具体来说，通过模拟顾客购物行为，对强化学习代理进行基准测试，以优化优惠券的定向投放。
关键思路

通过离线批处理数据训练代理，利用上下文匹配和深度强化学习方法来解决顾客购物行为数据稀疏的问题，提高优惠券定向投放的效果。
其它亮点

论文提供了一个实用的框架，用于模拟优化整个零售客户旅程的AI代理。实验结果表明，相比静态策略，上下文匹配和深度强化学习方法能够更好地解决稀疏奖励分布的问题。值得进一步研究的是如何进一步优化代理的性能，以及如何将该框架应用于其他领域。
相关研究

近年来，许多研究都致力于利用AI技术优化零售业务。例如，有研究使用深度学习技术预测客户流失，有研究使用自然语言处理技术分析客户评论。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问