论文链接:

https://dl.acm.org/doi/pdf/10.1145/3404835.3462908

本文主要针对的是如何从用户历史行为序列中学习到更鲁棒更有效的表征。用户历史行为序列中是存在噪声的,并且序列本身是稀疏的,因此本文针对现存的问题,提出CauseRec方法通过对反事实数据分布进行建模,更多地信任不可或缺的行为从而提高鲁棒性。给定行为序列,CauseRec识别可有可无的概念和不可或缺的概念,CauseRec 通过替换原始序列中的可有可无和不可或缺的概念,有条件地从反事实数据分布中采样用户概念序列。

CauseRec的本质是要回答这样一个问题“如果我们干预观察到的序列,用户表示会是什么”。首先确定历史行为序列中不可或缺/可有可无的概念。一个不可或缺的概念表示一个行为序列的子集,可以共同代表用户兴趣的一个有意义的方面。一个可有可无的概念表示一个噪声的子集,它在表示感兴趣的方面没有多大意义。对于可有可无的这些内容,替换成别的内容得到反事实序列后,该序列应与原序列具有相似语义,即和原序列一样能反映相似的用户偏好(这部分为正样本);相反的,如果替换了不可或缺的内容,那么反事实序列应该和原序列反映的用户偏好存在偏差(负样本)

内容中包含的图片若涉及版权问题,请及时与我们联系删除