在大多数搜广推场景中,广泛存在着各种各样的 bias。在不同的场景中,不同的 bias 造成的影响不同。比如推荐系统链路中存在的不一致性导致选择性偏差(多目标架构中的多阶段排序过程,存在于端上曝光以前),在端后影响较大的 bias 为曝光 bias、position bias 等。
推荐链路又是一个闭环反馈,在循环中无疑是强化加剧了这种 bias,导致系统性的流行性偏差和推荐结果的不公平性。短期内在用户体验上感知不强,但逐渐同向收敛,导致信息茧房,降低推荐结果的多样性和惊喜度;推荐内容的同质化倾向严重,使整体内容池的分发生态劣化。本文主要针对多阶段的排序部分,梳理推荐链路中的一致性建模策略;另外针对端上曝光后典型存在的 position bias 问题,对比 PAL 和 DPIN 两种模型的建模思路和实现方案。
重点推荐 SIGIR 对纠偏主题的两篇最佳论文,对更深刻地认识推荐系统中的偏差很有帮助。

1. “Should I follow the crowd? A probabilistic analysis of the effectiveness of popularity in recommender systems.” The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. 2018.

 

2. “Controlling fairness and bias in dynamic learning-to-rank.” Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. 2020.

内容中包含的图片若涉及版权问题,请及时与我们联系删除