导语

分享议程
分享议程
主题分享:杨宗瀚《智能体系统的统一对齐原则》
圆桌讨论 :
统一对齐原则可以怎样被泛化到多智能体领域?
怎么看待智能体与工具之间的关系,这是否是统一对齐原则里的一个安全挑战?
分享内容大纲
分享内容大纲
智能体系统的构成与统一对齐原则 统一对齐原则下现有交互环境、方法框架的综述评价 基于统一对齐原则的交互环境设计、方法框架设计、评价指标设计 统一对齐原则带来的启发与展望 关于智能体自主性与可靠性之间的辩证关系讨论
主要涉及到的前置知识
主要涉及到的前置知识
智能体
对齐
主讲人介绍
主讲人介绍

圆桌嘉宾介绍
圆桌嘉宾介绍

唐相儒:耶鲁大学计算机科学专业博士生。他的研究兴趣是大型语言模型,智能体和代码生成。他也是ICLR 2024 LLM Agents Workshop的核心组织者,个人主页为https://xiangrutang.github.io/。

主持人介绍
主持人介绍

涉及到的参考文献
涉及到的参考文献
Yang et al. Towards Unified Alignment Between Agents, Humans, and Environment. arXiv:2402.07744, 2024.
Yao et al. WebShop: Towards Scalable Real-World Web Interaction with Grounded Language Agents. NeurIPS 2022.
Tang et al. Prioritizing Safeguarding Over Autonomy: Risks of LLM Agents for Science. arXiv:2402.04247, 2024.
直播信息
直播信息

报名成为主讲人
报名成为主讲人
大模型安全与对齐读书会
大模型的狂飙突进唤醒了人们对AI技术的热情和憧憬,也引发了对AI技术本身存在的社会伦理风险及其对人类生存构成的潜在威胁的普遍担忧。在此背景下,AI安全与对齐得到广泛关注,这是一个致力于让AI造福人类,避免AI模型失控或被滥用而导致灾难性后果的研究方向。集智俱乐部和安远AI联合举办「大模型安全与对齐」读书会,由多位海内外一线研究者联合发起,旨在深入探讨大模型安全与对齐所涉及的核心技术、理论架构、解决路径以及安全治理等交叉课题。


点击“阅读原文”,报名读书会
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢