论文链接:https://dl.acm.org/doi/pdf/10.1145/3437963.3441761
本文通过注意力机制来实现的候选item和各种特征之间的各种交互。
以用户历史行为序列作为特征进行推荐的方法已经存在许多了,但是依旧存在一些问题,本文针对其中的三个问题,提出了多交互注意力机制网络(MIAN)。
-
很多网络都用到了注意力机制,但是用户经常会点击与历史交互的item无关的新item(IUIM、ICIM)。
-
有的用户只有很久以前的历史行为,而近期不活跃,没有相应的历史数据,因此很难从这些数据中捕获用户近期的偏好(IBIM中的加权、IUIM、ICIM)。
-
在不同的特征子空间,用户历史行为的表征存在巨大差别(GIM)。
本文提出的MIAN主要包含:
IBIM:Item-Behaviors Interaction Module,item行为交互模块。这部分采用Pre-LN Transformer(比较轻量级,参数少)来挖掘用户历史行为中的偏好,主要包含:layer norm、multi-head self-attention、 position-wise feed-forward networks 。
IUIM:Item-User Interaction Module,item-user交互模块。IUIM这部分主要是考虑候选item和用户画像之间的关系,用户的兴趣不一定能从历史交互中获取,因为可能用户近期不活跃,交互数据是很久以前的。此时,可以从用户画像来反映用户本身具有的特点,从而挖掘其偏好。
ICIM:Item-Context Interaction Module,item-context交互模块。这里考虑的是上下文对用户兴趣偏好的影响,操作方式和IUIM类似,先将context表征和候选item表征拼接,然后经过注意力机制对其进行加权。
GIM:Global Interaction Module,全局交互模块。这个模块,作者由DCN得到启发,将低阶信息和高阶信息进行交互融合,捕捉原始特征和交互特征之间的关系。作者将所有特征拼接后,同样采用注意力机制。
这也给我们一些启发,即把这些表征之间进行显式交互,计算相关性。针对背景中的问题:
-
利用GIM对不同子空间中的表征进行加权,从而对存在差异的表征方式进行融合
-
利用ICIM、IUIM来挖掘用户偏好,是的用户历史序列不可用时能够反映用户的偏好,但是这其实就是传统的方式,例如DCN这些。因此感觉只是说更进一步的利用注意力机制进行显式交互。
-
利用IBIM获得序列信息,并对历史表征进行加权,不同权重反映不同的作用。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢