【标题】Data-Driven Simulation of Ride-Hailing Services using Imitation and Reinforcement Learning 【论文链接】https://arxiv.org/pdf/2104.02661.pdf 【作者团队】Haritha Jayasinghe, Tarindu Jayatilaka, Ravin Gunawardena, Uthayasanker Thayasivam 【发表时间】2021.4.6 【推荐理由】本文提出了一个新的数据驱动的仿真框架,该框架使用模仿学习和分类深度Q网络来模拟乘车平台中的驾驶员行为进行建模。其在预测整个星期的需求和平台产生的总收入时,误差率不到10%。此外,在模拟环境中对特定于平台的参数进行调整时,可以通过强化学习来观察代理行为的变化。该框架表明任何乘车服务,都可以使用仿真学习进行模拟。
乘车平台的快速发展创造了一个竞争激烈的市场,企业在此市场上努力盈利,因此需要更好的运营策略。然而,由于这些平台每天要与数百万的用户打交道,因此对于这些平台而言,现实世界的实验是既冒险又昂贵。因此,需要一种模拟环境,在该环境中,企业可以预测用户对平台的特定参数(例如,票价和激励措施)变化的反应。建立这样的模拟具有挑战性,因为这些平台处于成千上万的用户定期进行交互的动态环境中。基于此,本文提出了一种框架,用于模仿和预测乘车服务中的用户行为,尤其是驾驶员行为。为此,我们使用数据驱动的混合强化学习和模仿学习方法。首先,代理利用行为克隆来使用现实世界的数据集模拟驾驶员的行为。其次,强化学习应用于模拟环境中预先训练的代理之上,以允许他们适应平台的变化。该框架为乘车平台提供了理想的平台,让他们用平台特定的参数来预测司机的行为模式。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢