带你读懂整个推荐系统的核心架构

许多推荐系统与LLM结合的新成果，还是尝试为主，只是将大模型的能力应用于改造推荐的一部分。但大模型或许可以给全链路的统一推荐提供一种可能。

但是推荐领域依然存在很多难题，例如冷启动问题和探索利用问题，这些问题至今没有被完美地解决。

在大模型来临后，推荐系统到达了变革前期。原有的系统模块比如核心架构、冷启动、多场景多任务等，会有什么突破？而模型创新、与大模型交叉等，又会有哪些新的进展？

2023年8月26-27日 09:00-12:30，DataFun将举办DataFunSummit2023：推荐系统在线峰会。本次峰会由3位专家团成员与8位论坛出品人精心策划而成，共包含：核心架构、模型创新、工程架构与训练推理、最佳实践、大模型与推荐、图与推荐、推荐冷启动、多场景多任务等8个论坛。本次峰会将全程直播，欢迎大家识别下面任意海报二维码报名收看。

▍专家团（按字母排序）

👨‍💼王喆字节跳动技术经理、Ads Ranking方向负责人

个人介绍：目前任字节跳动技术经理，Ads Ranking方向负责人。曾任Roku推荐系统架构负责人，Hulu高级研究员，品友互动广告效果算法组负责人。毕业于清华大学计算机系，主要研究方向为推荐系统、计算广告，发表相关领域学术论文和专利20余项。曾任DLP-KDD联合主席，KDD、CIKM等国际会议审稿人，。SparrowRecSys，SparkCTR等开源项目发起人和主要贡献者，10k+ stars。著有《深度学习推荐系统》，《百面机器学习》等技术书籍，读者10万+。

👨‍💼张俊林新浪微博新技术研发负责人

个人介绍：张俊林，中国中文信息学会理事，中科院软件所博士。目前担任新浪微博机器学习团队新技术研发负责人，在此之前在阿里担任资深技术专家。他是技术书籍《这就是搜索引擎：核心技术详解》（该书荣获全国第十二届优秀图书奖）、《大数据日知录：架构与算法》的作者。

👨‍💼朱小强汇量科技首席人工智能官

个人介绍：朱小强，汇量科技首席人工智能官，毕业于清华大学，拥有十多年头部互联网企业广告产品技术研发经验。加入汇量科技之前曾担任阿里巴巴展示广告技术负责人，并兼任 AI 算法平台负责人，领导和主持了阿里开源的工业级深度学习框架X-DeepLearning的研发，在KDD/AAAI/ICDM/CIKM等顶会上发表了数十篇工业实践论文，2019年开始牵头创办了业界首个面向工业级深度学习实践的技术论坛DLP workshop并连续担任了5届联席主席。

▍论坛详情

2023年8月26日，09：00-12：35

① 核心架构论坛

👨‍💼出品人：陈凯龙 QQ音乐推荐算法架构负责人

个人介绍：目前就职于QQ音乐平台产品部，负责QQ音乐推荐算法架构的设计与开发。加入QQ音乐之前在Pinterest负责主页推荐系统的开发和优化，在推荐系统上有多年的研究经验，在WWW, SIGIR, RecSys等会议上发表多篇相关论文。

👨‍💻段雪涛百度主任架构师

个人介绍：百度推荐系统基础架构技术负责人，主要负责百度feed基础架构、云原生技术架构以及成本、效能优化。加入百度前，曾工作于微软亚洲研究院、盛大创新院，在搜索引擎、爬虫、推荐系统等领域有十余年的探索和工业实践，对大规模在线服务的架构设计、云原生化有着丰富的实战经验。

🔥演讲题目：基于深度云原生的推荐系统架构设计与实现

演讲提纲：云原生（Cloud Native）作为大型互联网技术的基础建设基座，在容器、编排平台、微服务等方面已经趋于成熟，并在扩展性、稳定性、高可靠性等诸多方面推动了业务的技术进步，支撑了业务的快速发展。在本次分享中，我们将以推荐系统的云原生技术落地为例，分享容器标准化、微服务治理、容量管理和编排、混沌工程、流量治理等技术落地经验。

🎁听众收益：

1. 容器的标准化规范

2. 容器的亲和度部署编排

3. 微服务容量和流量治理

4. 混沌工程的规模化落地

👨‍💻方剑冰快手推荐系统架构师

个人介绍：方剑冰，清华大学硕士，现负责快手自研通用策略引擎 Dragonfly 的生态研发，此前在微软亚洲工程院 Bing 团队参与搜索和浏览器日志数据平台的建设，于 2018 年加入快手作为核心人员从零开始建设快手推荐中台，拥有丰富的在线服务架构经验。

🔥演讲题目：快手Dragonfly策略引擎的设计与应用

演讲提纲：快手近年来在用户量、业务量和研发人员数量上的显著增长，给快手的推荐系统架构带来了巨大的挑战，从早年的单一业务场景到现今的多领域多业务场景，如何用一套通用框架支撑各业务的快速搭建及高效迭代，同时降低工程维护成本、扫除业务迭代与架构升级之间的互相阻碍？为此我们自研了 Dragonfly 策略引擎，并在推荐、搜索及商业化三大领域均取得成功应用。本主题将介绍快手推荐系统服务架构的发展历程，从痛点问题入手分享架构升级的设计理念，并展示 Dragonfly 在快手推荐系统中的实际应用。

🎁听众收益：

1. 了解快手推荐系统从专用策略引擎到通用图引擎的发展历程。

2. 如何解耦工程架构和策略算法的迭代。

3. 如何利用 DSL 做迭代提效及无用代码管控。

👨‍💻班超小红书推荐工程架构负责人

个人介绍：北京邮电大学硕士毕业，曾在优酷负责推荐工程架构，现在小红书负责推荐工程架构演进和持续优化。

🔥演讲题目：小红书在复杂搜推场景下的图化业务架构实践

演讲提纲：

1. 小红书的推荐工程架构

2. 图架构在搜推业务的实践

3. 热部署在算法提效的实践

🎁听众收益：统一图业务架构在搜推如何落地，如何通过热部署机制提高算法迭代效率。

👨‍💻林东阿里云高级技术专家

个人介绍：林东在宾夕法尼亚大学获得计算机博士学位。目前在阿里云开源大数据团队，任职高级技术专家，创建并负责开发 FeatHub 和 Flink ML 等开源项目。林东同时是Apache Flink 和 Apache Kafka PMC成员，日常参与这些项目的社区讨论和维护工作。在加入阿里云之前，林东曾在LinkedIn从事Apache Kafka开发，以及在谷歌大脑参与了下一代TensorFlow计算引擎的多项模块的设计开发工作。

🔥演讲题目：FeatHub：流批一体的实时特征工程平台

演讲提纲：本次演讲将介绍FeatHub的目标场景，架构, API设计，已经实现的优化，以及落地案例：

1. 总体介绍 FeatHub 在特征开发、部署、监控、分享过程中面临的场景、目标、痛点和挑战

2. FeatHub 的架构思路实践，及相关核心概念

3. FeatHub 在使用过程中的 API 基本使用

4. 已经完成的性能优化以及落地案例

🎁听众收益：

1. 支持数据科学家使用 FeatHub 来快速开发，部署特征工程作业，以及监控特征质量

2. 支持数据科学家使用 FeatHub 来分享和复用已经开发的特征，减少重复的开发工作

3. 支持平台使用 FeatHub 来优化作业性能，降低资源成本

👨‍💻经纶小红书机器学习引擎架构负责人

个人介绍：小红书机器学习引擎架构负责人，先后在百度、快手从事广告/推荐算法架构、模型工程等工作；目前负责小红书搜广推场景下的模型训练、预估、特征、数据工程等工作。

🔥演讲题目：搜广推场景下模型训推一体化架构

② 模型创新论坛

👨‍💼出品人：纪厚业京东集团博士管培生，京东推荐视频/直播召回负责人

个人介绍：纪厚业博士，京东集团博士管培生，京东推荐视频/直播召回负责人，主要关注图神经网络和推荐系统，在 WWW / AAAI / TKDE / TOIS / ICDM / EMNLP / MM等顶级会议/期刊发表论文10+篇并担任相应的审稿人，引用2100+，荣获WebConf最有影响力论文(2019)，WebConf Best Paper Nomination(2021)，世界人工智能大会青年优秀论文提名奖(2022)。曾在浙大/自动化所/字节/淘宝/蚂蚁金服/达摩院/华为/京东/腾讯分享图与推荐技术。

👨‍💻李海涛清华大学硕士研究生

个人介绍：李海涛，男，汉族，清华大学计算机系硕士，曾获国家奖学金，北京市优秀毕业生等奖项。研究兴趣集中于信息检索、自然语言处理等领域，已发表多篇SIGIR论文，曾获WSDM CUP两项任务第二，COLIEE一项任务第一。

🔥演讲题目：Constructing Tree-based Index for Efficient and Effective Dense Retrieval

演讲提纲：Recent studies have shown that Dense Retrieval (DR) techniques can significantly improve the performance of first-stage retrieval in IR systems. Despite its empirical effectiveness, the application of DR is still limited. In contrast to statistic retrieval models that rely on highly efficient inverted index solutions, DR models build dense embeddings that are difficult to be pre-processed with most existing search indexing systems. To avoid the expensive cost of brute-force search, the Approximate Nearest Neighbor (ANN) algorithm and corresponding indexes are widely applied to speed up the inference process of DR models. Unfortunately, while ANN can improve the efficiency of DR models, it usually comes with a significant price on retrieval performance.

To solve this issue, we propose JTR, which stands for Joint optimization of TRee-based index and query encoding. Specifically, we design a new unified contrastive learning loss to train tree-based index and query encoder in an end-to-end manner. The tree-based negative sampling strategy is applied to make the tree have the maximum heap property, which supports the effectiveness of beam search well. Moreover, we treat the cluster assignment as an optimization problem to update the tree-based index that allows overlapped clustering. We evaluate JTR on numerous popular retrieval benchmarks. Experimental results show that JTR achieves better retrieval performance while retaining high system efficiency compared with widely-adopted baselines. It provides a potential solution to balance efficiency and effectiveness in neural retrieval system designs.

🎁听众收益：

1. 好的树索引应该满足什么条件？

2. 树索引如何与编码器联合优化？

3. 如何进一步优化不可微的聚类？

祝帅百度资深研发工程师

个人介绍：2013年浙江大学计算机专业研究生毕业后加入百度。历任百度凤巢系统CTR模型组高级研发工程师，百度Feed流推荐系统召回组，排序组资深研发工程师至今。目前担任百度Feed流推荐粗排负责人。在百度工作期间，参与或领导建设了Mio-Learner/Abacus大规模离散DNN流式训练框架；主要工作包括：2014年深度学习首次应用于无线凤巢项目，2015年CTR3.0精排重排联合训练项目，2017年百度最高奖汉诺塔粗排双塔DNN项目，2018年深度学习覆盖全凤巢莫比乌斯项目，2021年Feed流推荐多目标端到端召回系统，2023年推荐大模型项目等。研究兴趣包括搜索广告系统，推荐系统，深度学习基础理论，深度学习框架，LLM在推荐系统的应用等。

🔥演讲题目：百度推荐排序技术的思考

演讲提纲：本次演讲主要介绍三个方面，即百度Feed推荐排序的特征设计，模型算法，以及架构设计；重点分享近几年来，我们在百度综合信息流场景，进行排序算法实践时的经验教训。本次报告的主要提纲是：第一部分介绍背景，包括百度综合信息流推荐的产品及数据背景，以及排序核心算法策略的设计原理；第二部分介绍特征体系，我们将从用户与系统在多个场景的交互过程开始，介绍离散特征设计原理以及推荐漏斗视角下的特征设计思路；第三部分介绍模型算法，主要从粗排与精排关系开始，分别介绍大规模离散DNN的场景泛化问题及解法，过拟合问题的一些解决思路等；第四部分介绍系统架构，主要从推荐漏斗分层设计原理，多模型联合训练原理，稀疏路由网络等三个角度介绍。最后总结及展望未来工作规划。

🎁听众收益：

1. 粗排的天花板是不是精排？粗排与精排模型的定位有何不同？

2. 粗排模型如何保证多召回分支公平排序的前提下，引入召回侧的信号，实现召回排序协同优化？

3. 从系统与人群层面，如何解决数据漂移所带来的泛化问题？

4. 全场景复杂多目标（20个左右）模型如何通过稀疏路由网络，基于算法架构co-design的思想，实现算力不变的前提下，复杂大模型的上线？

👨‍💻高崇铭快手算法实习生

个人介绍：中科大博三学生，快手算法实习生。目前研究兴趣在于将基于强化学习的智能策略落地在推荐系统，并解决其带来适应性问题。

🔥演讲题目：基于离线强化学习的用户满意度优化与评测

演讲提纲：实际的推荐场景中，公司追求的是用户的累计满意度，这让推荐系统成为一个决策问题，而非预测问题。决策问题最适合的模型是强化学习（RL），强化学习的训练需要模型与用户进行实时交互，这在推荐系统中不可行。因此，我们必须借助海量离线数据进行离线强化学习（Offline RL）。离线强化学习在推荐系统中还属于探索阶段，一系列问题需要解决。本次分享中，本人将分享基于离线强化学习的推荐策略的实现与评测。特别地，本人将针对策略中存在的“信息茧房”与“马太效应”进行讨论，并介绍本人的解决方案。

🎁听众收益：

1. 如何利用推荐系统离线数据开发基于强化学习的推荐策略？

2. 如何正确评测离线强化学习算法？

3. 推荐离线与在线指标优化区别是什么？

👨‍💻张鹏涛新浪微博技术专家

个人介绍：北京大学计算机应用博士，发表多篇机器学习相关论文，现在在新浪微博从事推荐算法和用户增长相关工作，关注领域包括个性化推荐系统、大语言模型、用户画像、数据挖掘等领域。

🔥演讲题目：我们能获得推荐系统的大模型吗？

演讲提纲：强大的记忆能力是NLP大语言模型性能优异的原因之一，这启发我们在推荐模型中构建一个独立的记忆机制，用来存储、学习和记忆任意组合特征，提升推荐模型性能。本次分享的主要内容包括：

1. 从 NLP 大模型出发

2. HCNet & MemoNet

3. 实验结果

🎁听众收益：

1. NLP 大模型对推荐模型设计有何启发？

2. 如何增强推荐模型的记忆能力？

3. 增强推荐模型记忆能力对模型性能影响大吗？

③ 工程架构与训练推理论坛

👨‍💼出品人：王志勇小红书搜推工程负责人

个人介绍：小红书搜推工程负责人，曾就职于阿里巴巴多条业务线，在搜索，推荐，广告架构域拥有12年从业经验，专注于搜推广一体化与AI架构的研发。目前整体负责小红书的搜索推荐工程团队。

👨‍💻廖小超百度推荐技术研发部主任研发架构师

个人介绍：毕业于中国科学院计算机专业, 从事推荐相关工程架构近十年。当前主要负责百度APP、好看视频等产品内的feed流机器学习工程相关工作，主导了内部在线预估架构几次大的更新换代，异构弹性训练引擎的建设。

🔥演讲题目：Lion异构计算在线预估系统

演讲提纲：精准的推荐是许多互联网产品的核心竞争力，构建在大规模稀疏离散DNN模型上的推荐模型是产品体验进化的核心AI能力。但与此同时推荐模型的日益复杂化和大量运用在大幅提升产品效果的同时，也消耗了大量的机器资源。如何在超大流量、模型复杂化、模型数量膨胀的背景下降低资源成本的开销是我们持续要面临的挑战，本次分享主要会聚焦于在线预估系统异构化相关的内容上，同时演讲中的内容已经成撰写论文并发表在 KDD2022上，Lion: A GPU-Accelerated Online Serving System for Web-Scale Recommendation at Baidu；论文链接：Lion: A GPU-Accelerated Online Serving System for Web-Scale Recommendation at Baidu | Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining

演讲目录：

1. 推荐系统简介

2. 在线预估系统异构计算的挑战

3. Lion全流程异构预估架构、异构通用模板库、通用类型DAG异构混合执行引擎、全流程异构加速

4. 进一步展望

🎁听众收益：

1. 了解深度学习在信息流领域的核心技术

2. 了解异构计算在非典型场景的应用实践并获得一些新启发

👨‍💻沙剑蚂蚁集团高级技术专家

个人介绍：先后在微软和蚂蚁从事广告及AI基础设施研发工作，目前负责蚂蚁在离线训练引擎团队，关注大规模分布式训练系统性能优化及其智能提效。目前专注于DLRover开源社区建设，欢迎共建可复现的高性能大模型训练优化技术栈。

🔥演讲题目：DLRover: 蚂蚁AI训练智能提效的实践与思考

演讲提纲：

1. AI基建的趋势与挑战

2. AI基建的目标与解法

3. DLRover架构与重点模块简介

4. 未来思考

🎁听众收益：

1. DLRover项目的背景与动机

2. 搜推稀疏大模型与对话大模型可否统一提效方案？

3. DLRover在绿色AI领域贡献（集群资源效率）

👨‍💻杨斯然阿里巴巴高级技术专家

个人介绍：杨斯然，阿里巴巴高级技术专家，AI工程方向架构师。

👨‍💻王泽寰 NVIDIA 开发经理

个人介绍：王泽寰是GPU 推荐系统框架Merlin HugeCTR 及相关产品（SoK, HPS, HKV）的开发经理，也是英伟达亚太GPU 计算专家研发团队经理。他毕业于北京邮电大学，自2012年加入英伟达一直从事GPU加速解决方案相关工作。

🔥演讲题目：NVIDIA-Merlin：基于GPU的训练和推理全套方案

演讲提纲：本报告将会全面介绍NVIDIA Merlin推荐系统，包括高层次的Merlin Model / Merlin System框架解决模型应用问题，也会包含低层次的丰富的工具函数库，HugeCTR, NVT, HPS, TFDE等用于更轻巧的功能集成。意在为广大推荐系统开发人员提供GPU加速的解决方案和思路。

🎁听众收益：

1. Merlin GPU 推荐系统端到端解决方案

2. GPU加速模型训练

3. GPU加速模型推理

👨‍💻骆兆楷腾讯机器学习框架高级专家

个人介绍：2016年加入NVIDIA，参与TensorRT开发。2018年加入阿里巴巴达摩院参与自动驾驶计算中台开发。2020年加入腾讯PCG从0-1参与打造GPU推荐领域深度学习计算框架（无量）的开发。

🔥演讲题目：腾讯PCG搜广推机器学习框架GPU性能优化实践

演讲提纲：

1. 介绍腾讯PCG搜广推业务背景。

2. 介绍无量机器学习框架核心模块。

3. 详细介绍各个核心模块的技术亮点和实践。

4. 介绍无量机器学习框架GPU应用实践收益。

🎁听众收益：

1. 通过实践分享可以让推荐业务结合GPU性能化或者最大的性价比收益。

2. 通过实践分享获得架构设计的灵感。

3. 通过实践分享获得推荐业务结合其他xPU做性能优化的灵感。

👨‍💻杨旭阿里云资深算法专家

个人介绍：南开大学数学博士，在阿里工作12年多，一直从事分布式算法研发，是批流一体的机器学习算法平台Alink的创始人，开源地址：GitHub - alibaba/Alink: Alink is the Machine Learning algorithm platform based on Flink, developed by the PAI team of Alibaba computing platform. ，文档及教程：Alink算法实验室

🔥演讲题目：基于Alink模型流的在线学习

演讲提纲：通过Alink模型流机制的介绍，串联起在线学习、模型验证、预测服务、离线训练典型场景。

🎁听众收益：

1. 搭建简单的在线学习+预测服务

2. 通过模型流机制，灵活配置训练任务与预测服务

④ 最佳实践论坛

👨‍💼出品人：李枚芳百度资深算法工程师

个人介绍：百度从事大商业 CTR，CVR，CTCVR，多目标多场景排序工作。

👨‍💻吴岳虎牙直播推荐算法工程师

个人介绍：北理工硕士毕业，先后就职于百度、阿里、虎牙等公司，八年推荐算法实战经验，目前负责虎牙直播推荐算法的相关工作。

🔥演讲题目：面向直播推荐场景的虎牙排序算法实践

演讲提纲：本次演讲介绍了虎牙直播的业务特点，分析了直播推荐算法相比其他推荐业务的差异和挑战，进一步从实时性，多目标，用户主播关系，长期价值等角度切入，介绍了虎牙直播排序算法的实践经验和技术创新。

🎁听众收益：

1. 直播内容实时生成，推荐算法如何与之匹配？

2. 用户主播关系是虎牙直播中的核心问题，如何衡量短期转化和长期价值？

3. 在多目标、用户长短兴趣等其他热点问题上，虎牙推荐的一些实践分享

👨‍💻张谋丰阿里巴巴高级数据工程师

个人介绍：本硕分别毕业于SFU和UNSW。毕业后入职阿里巴巴直到现在。主要从事搜索推荐，网络分析，等相关工作。

🔥演讲题目：阿里巴巴长文档推荐在企业数字化中的应用

🎁听众收益：

1. 企业数字化如何实现长文档推荐

2. 推荐系统如何与大模型结合

👨‍💻文亮奇虎360 高级算法专家

个人介绍：文亮，奇虎360高级算法专家，硕士毕业于电子科技大学信息与软件工工程学院，推荐系统技术原理与实践作者。主要研究方向有推荐系统、深度学习和信息安全，曾发表5篇相关领域的学术论文，其中3篇被EI收录。目前主要工作内容包括推荐系统模型优化，以及大模型应用实践。

🔥演讲题目：深度学习/大模型在推荐场景的落地

演讲提纲：聊聊深度学习在推荐场景的一些落地方案，多场景融合、多目标排序、知识蒸馏在推荐场景的应用，如何对召回和 Rank 统一建模。大模型 GPT 如何应用在推荐场景。

🎁听众收益：

1. 推荐系统多个场景如何融合？

2. 如何解决多目标排序的跷跷板现象？

3. 如何对召回、Rank 统一建模？

4. 如何将大模型应用于推荐场景？

👨‍💻胡作梁 58安居客资深算法工程师

个人介绍：2017年毕业于同济大学，一直从事58房产推荐相关工作。目前主要负责五八、安居客商业地产、爱房推荐相关工作。

🔥演讲题目：深度学习在互联网房产推荐场景的算法实践

演讲提纲：首先介绍58房产业务的现状及主要推荐场景，然后介绍目前行业流行的向量召回方法，包括i2i、u2i及大模型在召回中的应用，同时会介绍向量召回融合方法及在业务特点下部署遇到的难点和解决思路，最后介绍多任务、多场景多任务精排模型的一些实践经验。

🎁听众收益：

1. 基于向量召回的算法很多且各有优势，如何将它们融合且基于业务特点部署

2. 如何将大模型用于房产召回

3. 用户长短期兴趣特征的设计，多任务、多场景多任务算法实践经验

2023年8月27日，09：00-12：30

① 大模型与推荐论坛

👨‍💼出品人：唐睿明华为诺亚方舟实验室推荐与搜索实验室主任

个人介绍：唐睿明，华为诺亚方舟实验室资深研究员，任推荐与搜索实验室主任，负责推荐和检索领域的前沿研究和技术落地，研究方向包括机器学习、推荐系统、深度学习、强化学习、AutoML、图神经网络等。他于2009年在中国东北大学获得学士学位，并在2014年从新加坡国立大学计算机专业获得博士学位，2014年底加入华为诺亚方舟实验室。他在数据挖掘、机器学习、推荐系统和信息检索等领域的国际会议、期刊上发表论文50余篇。

🔥演讲题目：大语言模型在推荐系统应用现状与初步探索

演讲提纲：大语言模型为推荐系统提供了充分的语义信号和外部知识，但存在缺乏协同信号和线上推理时延问题。在本报告中，我们探究了推荐模型如何从大语言模型中受益，从而优化推荐性能和用户体验。我们首先介绍了一篇工业应用视角的综述工作，从Where和How两个角度，全面回顾了现有将大语言模型应用于推荐系统的工作。接着，我们将分享两个将大语言模型应用于推荐系统的技术框架。根据综述中对于How问题的分析，从模型角度，我们提出了一个利用大语言模型开放知识辅助推荐的通用框架；从数据角度，我们提出一个对齐大语言模型和协同信号的通用框架。

🎁听众收益：

1. 大语言模型应用于推荐系统的现状。

2. 大语言模型应用于推荐系统的挑战。

👨‍💻孙爱欣南洋理工大学副教授

个人介绍：孙爱欣博士是新加坡南洋理工大学计算机科学与工程学院（SCSE）的副教授和副院长（学术）。他分别在2001年和2004年获得南洋理工大学计算机工程一等荣誉学士学位和博士学位。他的研究兴趣包括信息检索、文本挖掘、社群计算和数字图书馆。他发表过200多篇论文，这些论文在谷歌学术上总共获得了16000多次引用，h指数为59。孙博士是ACM Transactions on Information Systems（TOIS）、Neurocomputing的副编辑，也是Journal of the Association for Information Science and Technology（JASIST）和Information Retrieval Journal的编辑委员会成员。他曾担任WSDM2023的 DC co-chair，SIGIR2020、ICDM2018、CIKM2017的 Demo co-chair，AIRS2019的PC co-chair，以及ADMA2017的General Chair。他还曾担任SIGIR、WWW、WSDM、EMNLP、AAAI和IJCAI等多个会议的领域主席、高级程序委员会成员或程序委员会成员。

🔥演讲题目：大语言模型是推荐系统的解决方案吗？（LLM, Yet Another Solution to RecSys?）

演讲提纲：本次演讲主要是从学术的角度探讨大语言模型在推荐系统领域可能的应用和挑战。学术界对于推荐系统的研究很大程度上受限于数据和平台，主要依赖于离线数据进行实验，观察，以及评测。然而，仅靠离线数据并不能完全捕捉推荐问题的复杂性，导致学术研究中问题的抽象化和简单化，所提出的方法也需要在实际场景的线上平台重新评测以确定其有效性。在本次演讲中，我将重新审视学术界的数据集、评测方法以及对推荐问题的理解，在此基础上，探讨大型语言模型是否可以作为推荐系统的解决方案。

🎁听众收益：

1. 如何理解学术界常用的推荐模型评测方式？

2. 如何理解学术界常用的推荐数据集？

3. 大语言模型适合推荐问题吗？

👨‍💻徐君中国人民大学高瓴人工智能学院教授

个人介绍：Jun Xu is a Professor at Gaoling School of Artificial Intelligence, Renmin University of China. His research interests focus on applying machine learning to information retrieval and recommendation. He has published more than 100 papers and 2 monographs at top international journals and conferences, including TKDE, TOIS, JMLR, SIGIR, KDD, WWW ACL etc. His work on information retrieval has received the Test of Time Award Honorable mention of ACM SIGIR 2019, Best Paper Runner-up of ACM CIKM 2017, and Best Paper Award of CCIR 2022 and AIRS 2010. He has served or is serving top international conferences as Senior PC members, including SIGIR, CIKM, AAAI, and top international journal of JASIST as an editorial board member, and ACM TIST as an associate editor. He received funding grants from the National Natural Science Foundation of China (NSFC) and National Key R&D Program of China.

🔥演讲题目：Uncovering ChatGPT's Capabilities in Recommender Systems

演讲提纲：The debut of ChatGPT has recently attracted significant attention from the natural language processing (NLP) community and beyond. Existing studies have demonstrated that ChatGPT shows significant improvement in a range of downstream NLP tasks, but the capabilities and limitations of ChatGPT in terms of recommendations remain unclear. In this study, we aim to enhance ChatGPT's recommendation capabilities by aligning it with traditional information retrieval (IR) ranking capabilities, including point-wise, pair-wise, and list-wise ranking. To achieve this goal, we re-formulate the aforementioned three recommendation policies into prompt formats tailored specifically to the domain at hand. Through extensive experiments on four datasets from different domains, we analyze the distinctions among the three recommendation policies. Our findings indicate that ChatGPT achieves an optimal balance between cost and performance when equipped with list-wise ranking. This research sheds light on a promising direction for aligning ChatGPT with recommendation tasks.

🎁听众收益：

1. 基于大模型的推荐方法

2. 大模型应用于推荐所面临的问题

👨‍💻冯福利中国科学技术大学特任教授

个人介绍：冯福利，中国科学技术大学特任教授，入选国家青年人才计划。研究领域：信息检索、数据挖掘、机器学习、因果推断等，承担推荐算法合规、监管相关国家级项目，发表国内外顶级会议和期刊论文近100篇，谷歌学术引用6000余次，研究成果在多家公司的商业系统应用。曾获SIGIR 2021最佳论文提名奖、WWW 2018最佳演示论文奖。

🔥演讲题目：大模型推荐技术及展望

演讲提纲：以GPT为代表的大语言模型（LLM）展示了惊人的新兴理解、推理和规划能力，催生了将LLM应用于推荐系统以提升性能和用户体验的有前景的研究方向。报告介绍大模型推荐技术的进展，包括如何教会LLM做推荐：1）基于in-context learning的LLM推荐能力激发，2）基于instruct- tuning的LLM推荐任务对齐；以及如何利用LLM推动推荐范式革新：3）基于LLM的生成式召回，4）基于LLM的生成式推荐。报告进一步讨论大模型推荐带来的机遇与挑战。

🎁听众收益：

1. 如何激发LLM推荐能力

2. 如何微调LLM形成推荐能力

3. 大模型推荐带来的机遇与挑战

陈旭中国人民大学准聘副教授

个人介绍：陈旭，博士毕业于清华大学，于2020年加入中国人民大学。他的研究方向为推荐系统，强化学习，因果推断等。曾在TheWebConf、AIJ、TKDE、SIGIR、WSDM、TOIS等著名国际会议/期刊发表论文60余篇。曾共同主导构建推荐系统工具包“伯乐”，可解释推荐数据集REASONER，以及基于大语言模型的推荐用户自主智能体仿真环境RecAgent等。他的研究成果曾获得TheWebConf 2018最佳论文提名奖、CIKM 2022 最佳资源论文Runner Up 奖和AIRS 2017最佳论文奖。同时，他也曾荣获CCF自然科学二等奖（排名第二），ACM-北京新星奖（北京市三人）等。他的研究成果在多家企业落地，相关成果荣获华为“创新先锋”总裁奖。他主持/参与多项国家自然科学基金以及企业合作项目。

🔥演讲题目：基于大语言模型的自主智能体构建与应用

演讲提纲：近年来，以Generative Agent为代表的基于大语言模型的智能体研究吸引了科研人员的广泛关注。本次报告围绕基于大语言模型的智能体构建，应用和评价展开，概要介绍利用大语言模型构建通用和领域专用智能体的关键技术，分析该领域的现存挑战，并展望未来的发展方向。

② 图与推荐论坛

👨‍💼出品人：易玲玲腾讯微信事业群专家研究员

个人介绍：互联网从业十余年，专注于用户行为数据的分析和挖掘、推荐算法的研究和应用。曾负责社交推荐算法在朋友圈广告、公众号社交阅读等场景的应用，在Network embedding和GNN等图算法技术的落地方面有着丰富的实战经验。最近三年，主要专注于利用丰富的跨域数据、GNN技术来解决推荐系统的数据稀疏性问题。

👨‍💻纪厚业京东集团博士管培生，京东推荐视频/直播召回负责人

个人介绍：纪厚业博士，京东集团博士管培生，京东推荐视频/直播召回负责人，主要关注图神经网络和推荐系统，在 WWW / AAAI / TKDE / TOIS / ICDM / EMNLP / MM等顶级会议/期刊发表论文10+篇并担任相应的审稿人，引用2100+，荣获WebConf 最有影响力论文(2019)，WebConf Best Paper Nomination(2021)，世界人工智能大会青年优秀论文提名奖(2022)。曾在浙大/自动化所/字节/淘宝/蚂蚁金服/达摩院/华为/京东/腾讯分享图与推荐技术。

🔥演讲题目：图机器学习在京东视频召回中的应用

演讲提纲：本次演讲主要介绍在京东电商视频化过程中, 如何将图机器学习与视频召回业务结合并落地。本次报告的主要提纲是：第一部分介绍背景，包括京东视频化业务特色和挑战和图机器学习基础；第二部分主要介绍图召回通用能力建设, 包括图神经网络架构设计和预训练；第三部分介绍2 个具有业务特色的图召回, 包括视频外页交互图召回和视频内页子图召回；最后总结及展望未来工作规划。

🎁听众收益：

1. 电商视频化过程中, 如何问题, 挑战和收益？图机器学习对于视频召回的价值?

2. 如何提升图神经网络表示能力并实现大规模的预训练, 进而服务于下游多种召回？

3. 如何设计具有业务特色的图召回算法?

👨‍💻谷皓腾讯算法工程师

个人介绍：微信技术架构部T11级算法工程师，参与微信内视频号直播、订阅号、游戏红点等推荐业务的算法迭代，主要负责 GNN 跨域推荐算法的应用和落地。

🔥演讲题目：GNN跨域推荐在微信业务上的应用

演讲提纲：推荐算法始终面临着数据稀疏的问题。对于大部分的长尾用户，因为数据稀疏推荐不够精准，给业务带来冷启动、拉新难、增长慢的问题。目前，我们团队应用GNN跨域推荐技术，结合微信平台上多个业务（多个源域）的数据，为多个业务解决冷启动的问题，为低活用户提升推荐性能，为高活用户突破信息茧房。本次分享主要从算法、工程落地两个方面对GNN跨域推荐技术进行阐述。

🎁听众收益：

1. 使用GNN 和异构图缓解推荐系统数据稀疏

2. 使用跨域推荐提高推荐效果

3. 如何搭建实时 GNN 推荐系统

👨‍💻李本利快手图数据库工程师

个人介绍：在滴滴,腾讯,快手从事多年数据库研发工作。近年来专注于图数据库内核研发，追求强一致，低成本，高性能，致力于满足用户更多使用场景。

🔥演讲题目：快手图数据库存算分离架构及其在实时推荐召回的应用

演讲提纲：

1. 快手基于图数据库的实时推荐案例

2. 快手自研图数据库架构原理

🎁听众收益：

1. 用图数据库做实时推荐

2. 低成本，高性能：图数据库存算分离架构

👨‍💻吴郑伟蚂蚁集团高级算法专家

个人介绍：2014年硕士毕业于巴黎理工学院应用数学系，现任蚂蚁集团高级算法专家，主要从事图机器学习相关技术的研究与应用，特别关注于搜索、营销、推荐等场景。共计在NeurIPS、KDD等国际会议发表论文10余篇。

🔥演讲题目：图算法在蚂蚁集团营销推荐场景的应用

演讲提纲：

1. 蚂蚁营销推荐的背景

2. 蚂蚁图学习系统

3. 营销推荐图学习算法

🎁听众收益：营销推荐场景针对行为稀疏问题，如何使用图学习进行有效建模。

👨‍💻牛化康百度资深研发工程师

个人介绍：四川大学硕士，百度资深推荐算法工程师，参与了百度Feed流从0->1的建设，完成了图模型在Feed首次落地（百度最高奖top10），目前是召回方向负责人。

🔥演讲题目：图模型在百度推荐系统的实践与思考

演讲提纲：

1. 图模型的发展

2. 多域图模型在百度推荐的应用

🎁听众收益：

1. 多域图如何实现多推荐场景覆盖

2. 如何有机结合搜索推荐场景信号

③ 推荐冷启动论坛

👨‍💼出品人：王晓博小红书技术副总裁

个人介绍：博士毕业于北京航空航天大学计算机学院；在互联网领域从事搜索、推荐、广告相关业务的算法策略及技术管理工作。主要研究方向为机器学习、计算广告学、智能化搜索推荐、智能化内容创作等。从业十多年期间，先后在 SIGKDD、ICML、IJCAI、NeurIPS、CIKM、MM 等国际会议发表论文十余篇。

👨‍💻李善涛百度资深研发工程师

个人介绍：硕士，百度资深研发工程师，负责百度信息流推荐分发生态相关技术工作。

🔥演讲题目：百度推荐资源冷启动实践

演讲提纲：

1. 推荐系统内容冷启动概念与挑战

2. 内容冷启动推荐算法设计

3. 内容冷启动实验方案

🎁听众收益：

1. 内容冷启动对于信息流产品的生态有何影响？

2. 内容冷启动有哪些挑战，如何应对？

3. 如何衡量内容冷启动策略的好坏？

👨‍💻丘志杰快手内容增长部内容增长推荐算法专家

个人介绍：研究生毕业于中国科学院计算技术研究所，2016年毕业后先后在微软，腾讯，快手从事推荐算法研究与落地，目前在快手负责内容冷启动推荐算法的研究与优化。

🔥演讲题目：快手内容冷启动推荐模型实践

演讲提纲：快手的内容冷启动团队解决什么问题冷启动问题的困难和挑战我们的解决方案内容冷启动方向的未来展望

🎁听众收益：

1. 了解工业界海量内容冷启动的挑战和实践现状

2. 快手如何通过泛化，探索，纠偏，迁移等模型方案提升冷启动内容推荐效率

3. 快手在冷启动真实求解空间上的模型解决方案实践

👨‍💻任俞明网易云音乐高级算法工程师

个人介绍：毕业于北京航空航天大学，目前在网易云音乐担任算法工程师，主要负责音乐冷启动、潜力内容挖掘、召回与精排算法优化相关工作。

🔥演讲题目：音乐推荐的多模态冷启技术

演讲提纲：

1. 音乐冷启动的背景与难点

2. 多模态冷启动算法的设计

3. 云音乐在冷启动方面的成果

🎁听众收益：

1. 零交互记录的 item 如何在推荐系统中实现高效精准的冷启动

2. 多模态内容信息在推荐算法中的应用

3. 对比学习技术在推荐中的实践

④ 多场景多任务论坛

👨‍💼出品人：王哲美团高级算法专家

个人介绍：中国科学技术大学硕士，曾在蚂蚁金服负责跨境游业务，在阿里妈妈展示广告负责粗排及全链路联动等工作，目前在美团到店广告平台负责搜索广告模型。

👨‍💻卢玉奇百度主任架构师

个人介绍：负责百度APP视频推荐策略和体验优化等工作，先后在商业策略、好看视频推荐、PUSH推送、百度feed等方向工作，专注推荐和广告算法领域，践行以算法和策略驱动业务快速增长。

🔥演讲题目：百度视频沉浸式推荐多目标融合的实践和思考

演讲提纲：

1. 视频推荐系统概览介绍

2. 视频推荐多目标的设计和建模

3. 多目标融合的演变和序列建模

🎁听众收益：

1. 了解视频沉浸式推荐场景下的推荐多目标的设计，并启发大家进一步做些思考

2. 了解百度信息流排序建模的演变，和跨域大模型建模的实践经验

3. 多目标如何融合、从pointwise到满意度LTR，再到序列建模的实践

👨‍💻周杰美团算法工程师

个人介绍：毕业于北京航空航天大学。目前就职于美团到店事业群，负责到店C端排序业务的迭代，从事多场景多任务建模技术的探索与落地的相关工作。

🔥演讲题目：一种基于层次化信息抽取的多场景多任务建模方法

演讲提纲：

1. 背景与挑战

2. 创新点与模型架构

3. 实验与消融分析

4. 在线AB实验

5. 总结与未来展望

🎁听众收益：

1. 如何通过多场景多任务建模解决多场景排序问题？

2. 层次化信息抽取的优点是什么？

👨‍💻刘殊畅快手高级算法工程师

个人介绍：刘殊畅博士，22年毕业于罗格斯大学，师从张永锋老师。在推荐领域有多篇工作收录于SIGIR、WWW、KDD，RecSys和WSDM。毕业后加入快手，负责快手极速版推荐算法研发，期间有多篇工作被WWW2023和KDD2023接收，这次将会分享其中两篇。

🔥演讲题目：强化学习与多任务推荐

演讲提纲：近年来，多任务学习（MTL）在推荐系统（RS）应用中取得了巨大的成功。然而，目前大部分基于 MTL 的推荐模型往往忽略了用户与推荐系统互动的会话（session）模式，因为它们主要是依据基于单个 item 的数据集而构建。平衡多个输出目标一直是该领域的一个挑战。为了解决这个问题，我们提出了一个基于强化学习（RL）的 MTL 框架，即 RMTL 。该框架使用动态权重来平衡不同的推荐任务的损失函数。我们在基于 KuaiRand 等多个公开数据集的实验证明了 RMTL 的有效性，其 AUC 显著高于 SOTA 基于 MTL 的推荐模型。我们还验证 RMTL 在各种 MTL 模型中的表现，证明其具有良好的兼容性和可转移性。该工作已被 WWW 2023 Research Track 接收；另外，我们还将分享我们在 WWW 2023 Research Track 提出应对强化学习推荐中多目标挑战的TSCAC算法。

🎁听众收益：

1. 如何将多目标学习从单个 item 推荐拓展到整个 session？

2. 如何采用强化学习方法更好地平衡多个目标？

3. 强化学习推荐算法中，如何做到多个目标更好的平衡？

👨‍💻王奕超华为诺亚方舟实验室高级工程师

个人介绍：毕业于北京大学，目前就职于华为诺亚方舟实验室从事推荐、广告算法方面的研究和应用工作，主要的研究兴趣在于多任务、多场景、增量学习等。

🔥演讲题目：多任务和多场景在推荐系统中的应用

演讲提纲：1. 多任务/多场景联合建模背景和挑战 2. 多任务/多场景联合建模算法分类和介绍 3. 多任务/多场景算法的应用和分析 4. 推荐系统中，多任务/多场景算法的发展方向思考

🎁听众收益：

1. 了解多任务/多场景推荐算法的背景和原理

2. 了解如何构建一个多任务/多场景推荐模型

3. 了解多任务/多场景算法的发展方向

👇点击阅读原文，免费报名参会

内容中包含的图片若涉及版权问题，请及时与我们联系删除

带你读懂整个推荐系统的核心架构

① 核心架构论坛

② 模型创新论坛

③ 工程架构与训练推理论坛

④ 最佳实践论坛

2023年8月27日，09：00-12：30

① 大模型与推荐论坛

② 图与推荐论坛

③ 推荐冷启动论坛

④ 多场景多任务论坛

评论列表

评论