- 简介我们解决了一个具有挑战性的问题,即如何动态定价顺序展示给顾客的互补商品。一个例子是在线销售机票,顾客需要浏览多个网页,首先看到的是机票价格,然后是额外的费用,例如保险和额外的行李费用。对互补商品进行一致的定价策略非常重要,因为单独优化每个商品的定价是无效的。我们的情景还涉及销售约束,即规定销售最低数量的商品,以及客户需求曲线的不确定性。为了解决这个问题,我们最初将其制定为带有约束的马尔可夫决策过程。利用在线学习工具,我们设计了一个原始-对偶在线优化算法。我们使用从真实数据随机生成的合成设置进行了实证评估,涵盖了从静止到非静止的各种配置,并将其在约束违规和遗憾方面与单独优化每个状态的知名基线进行了比较。
-
- 图表
- 解决问题本论文研究的问题是如何动态定价在顺序展示给顾客的互补商品中,以最小化成本并满足销售约束和不确定的顾客需求曲线。
- 关键思路本论文的关键思路是将问题建模为带有约束的马尔可夫决策过程,并设计了一个基于在线学习算法的原始-对偶在线优化算法来解决这个问题。
- 其它亮点论文使用了合成数据集进行了实验评估,并与优化每个状态的已知基线进行了比较。实验结果表明,该算法在满足约束条件和减少后悔方面表现出色。本论文的亮点包括使用在线学习算法解决动态定价问题,提出了一个能够适应不确定需求曲线和销售约束的优化算法。
- 最近的相关研究包括“基于强化学习的动态定价”和“在线优化算法在动态定价中的应用”。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流