Dynamic Pricing and Learning with Bayesian Persuasion
解决问题:该论文旨在解决动态定价和学习的问题,其中除了在连续回合中设置产品价格外,卖方还可以事先承诺“广告方案”,即在每一轮开始时,卖方可以决定提供什么样的信号给买方,以便买方了解产品的质量。使用贝叶斯劝说框架来建模这些信号对买方估值和购买反应的影响,我们制定了一个问题,即找到一种最优的广告方案设计和定价方案,以最大化卖方的预期收益。我们的目标是设计一种在线算法,它可以使用过去的购买响应来自适应性地学习最优的定价和广告策略。我们研究了算法与最优清醒价格和广告方案相比的遗憾。
关键思路:本文的关键思路是使用贝叶斯劝说框架来建模广告信号对买方估值和购买反应的影响,并设计了一个在线算法来自适应性地学习最优的定价和广告策略。相比当前领域的研究状况,本文的思路在动态定价和学习方面有了新的探索。
其他亮点:本文的亮点包括提出了一个新的动态定价和学习问题,设计了一个在线算法来解决这个问题,并给出了遗憾上界。实验使用了贝叶斯劝说框架,没有先验知识。本文的算法是计算有效的,并且在一些情况下能够匹配动态定价的遗憾下界。本文还提出了一些改进的结果,包括对加法估值的广泛考虑的特殊情况。
关于作者:Shipra Agrawal,Yiding Feng和Wei Tang是本文的主要作者。他们来自哥伦比亚大学和华盛顿大学。之前,Shipra Agrawal曾发表过“Optimal Regret Analysis of Thompson Sampling in Stochastic Multi-Armed Bandit Problem”等论文,Yiding Feng曾发表过“Online Learning with Non-Stationary Rewards”等论文,Wei Tang曾发表过“Online Learning with Unknown and Changing Distributions”等论文。
相关研究:近期的其他相关研究包括“Dynamic Pricing with Limited Supply”(作者:Geng et al.,机构:加州大学伯克利分校),“Dynamic Pricing under a General Utility Function: Optimal Regret Analysis”(作者:Wang et al.,机构:南洋理工大学),以及“Online Learning for Dynamic Pricing with Unknown Demand and Capacity Constraints”(作者:Yuan et al.,机构:新加坡国立大学)。
论文摘要:本文考虑了一种新颖的动态定价和学习情境,卖家除了在连续的回合中设置产品价格外,还要事先承诺“广告方案”。也就是说,在每个回合开始时,卖家可以决定他们将向买家提供关于产品质量的什么样的信号。使用流行的贝叶斯说服框架来模拟这些信号对买家估值和购买反应的影响,我们制定了一个问题,即找到一个最优的广告方案设计和定价方案,以最大化卖家的预期收入。在没有任何先验知识的情况下,我们的目标是设计一个在线算法,可以使用过去的购买反应来自适应地学习最优的定价和广告策略。我们研究了算法相对于最优全知价格和广告方案的遗憾。我们的主要结果是一个计算效率高的在线算法,当估值函数是产品质量的线性函数时,可以实现$O(T^{2/3}(m\log T)^{1/3})$的遗憾界。这里,$m$是离散产品质量域的基数,$T$是时间跨度。这个结果需要在估值函数上一些自然的单调性和Lipschitz假设,但没有关于买家需求函数的Lipschitz或平滑性假设。对于常数$m$,我们的结果与动态定价的遗憾下限相匹配,这是我们问题的一个特例,只是有对数因子。我们还获得了一些改进的结果,适用于广泛考虑的加性估值的特殊情况,包括当$m\le T^{1/3}$时,独立于$m$的$\tilde{O}(T^{2/3})$遗憾界。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢