图片

论文链接:

https://arxiv.org/abs/2212.08262

代码链接:

https://github.com/kinggugu/ticoserec

序列推荐已经成为一项重要的推荐任务,根据用户的历史交互序列预测下一个时间点用户访问的项目。作者发现序列中两个项目交互的时间间隔并没有得到广泛的关注,特别是考虑到兴趣偏移时。

 

图 1 是从真实数据集中抽取的一个例子。两个用户拥有相同长度的交互序列,但他们交互间隔的分布却相差很多。用户 1 的时间间隔分布相对用户 2 更为均匀。用户 1 购买的大多数产品都属于皮肤/面部护理类别,而用户 2 购买的产品类别却随着时间发生了较大的改变(从发胶到睫毛膏,从睫毛膏到保湿霜)。

 

直观地认为,由于用户 1 的序列比其他用户分布更均匀,因此模型可以更好地学习用户偏好。作者将用户 1 这种序列称为“均匀序列”,用户 2 称为“非均匀序列”。

图片

在本文中,作者进行了实证研究来进一步验证这一猜想。实验结果表明,均匀序列比非均匀序列可以显著提高模型性能,然而,真实数据集中序列在时间间隔上不能均匀分布是一个很普遍的现象。基于实证研究的结果,作者提出了五个时间间隔感知的数据增强算子(Ti-Crop, Ti-Reorder, Ti-Mask, TiSubstitute, Ti-Insert)来将非均匀序列转换为均匀序列。此外,作者应用对比学习来确保增强序列与原始序列保持较高的相似性。作者在一个最先进推荐模型 CoSeRec 上实现了作者的方法,并提出了 TiCoSeRec。

 

本文的主要贡献有:

1. 作者进行了实证研究来验证均匀序列比非均匀序列更有利于模型性能提升。据作者所知,这是第一个对序列推荐时间间隔分布的研究。

2. 作者提出了 5 个数据增强算子,将非均匀序列转换为均匀序列,此外,作者还设计了一种控制策略来处理短序列的数据增强。

3. 作者在 4 个真实数据集上进行了广泛的实验,并证明了与其他 11 个竞争模型相比,作者的方法 TiCoSeRec 可以实现显著的性能提高。

内容中包含的图片若涉及版权问题,请及时与我们联系删除