作者:Duncan McElfresh, Sujay Khandagale, Jonathan Valverde,等
简介:本文提出通过预训练模型的元学习方法研究推荐系统的泛化性和可预测性。虽然机器学习的其他领域已经看到越来越多的自动化,但设计一个高性能的推荐系统仍然需要大量的人力。此外,最近的工作表明,现代推荐系统算法并不总是比调整好的基线有所改进。一个自然的后续问题是,“我们如何为新的数据集和性能指标选择正确的算法?” 在这项工作中,作者首先通过比较 85 个数据集和 315 个指标的 18 种算法和 100 组超参数,对推荐系统方法进行了第一次大规模研究。作者发现最好的算法和超参数高度依赖于数据集和性能指标,然而,每种算法的性能与数据集的各种元特征之间也存在很强的相关性。受这些发现的启发,作者创建了 RecZilla,这是一种推荐系统的元学习方法,它使用模型来预测新的、看不见的数据集的最佳算法和超参数。通过使用比以前的工作更多的元训练数据,RecZilla 能够在面对新的推荐系统应用程序时大大降低人工参与的水平。作者不仅发布了作者的代码和预训练的 RecZilla 模型,还发布了作者所有的原始实验结果,以便从业者可以训练 RecZilla 模型以获得所需的性能指标。
论文下载:https://arxiv.org/pdf/2206.11886.pdf
代码下载:https://github.com/naszilla/reczilla
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢