【标题】Reinforcement Learning to Rank with Coarse-grained Labels
【作者团队】Zhichao Xu, Anh Tran, Tao Yang
【发表日期】2022.8.16
【论文链接】https://arxiv.org/pdf/2208.07563.pdf
【推荐理由】排名是许多信息检索 (IR) 任务的核心。 现有的使用深度神经网络 (DNN) 进行排序学习 (LTR) 依赖于细粒度标签,在实践中,细粒度标签的获取成本通常很高。与细粒度标签相比,粗粒度标签更容易收集,也更便宜。 最近的一些工作建议仅将粗粒度标签用于 LTR 任务。 本文介绍了基于强化学习 (RL) 的 LTR 算法。 与监督学习相比,RL 可以帮助训练 LTR 模型,几乎不依赖细粒度标签。 为了研究基于 RL 的 LTR 算法在粗粒度标签上的有效性,本文实现了四种不同的 RL 范式,并对两个成熟的 LTR 数据集进行了广泛的实验。 模拟粗粒度标签数据集的结果表明,虽然使用粗粒度标签来训练 LTR 任务的 RL 模型仍然不能胜过使用细粒度标签的传统方法,但它仍然取得了一些有希望的结果,并且可能对未来在 LTR 中的研究有所帮助 。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢