清华大学基础模型研究中心将于6月25日下午15:00举办系列讲座第23期,清华大学长聘副教授、清华大学心理与认知科学系副主任、清华大学终身学习实验室研究主管:伍珍将以"从共情到利他:心理学如何让AI更人性化—AI的道德价值对齐新路径" 为题作报告。


本次讲座对公众开放,欢迎校内外人士参加并共同探讨基础模型领域的前沿话题,校外人士请自行解决入校报备事宜。


报告时间:2025年6月25日(星期三) 15:00-16:30

报告地点:清华大学FIT楼1-312

主 讲 人:  伍珍

主 持 人:  黄民烈 清华大学计算机系教授、基础模型研究中心副主任


报告信息


报告题目 


从共情到利他:心理学如何让AI更人性化

—AI的道德价值对齐新路径


报告摘要


大语言模型在逻辑推理、代码生成等认知任务方面取得了重要进展,但要成为人类可信赖的“超级助手”,AI还需要真正理解并践行人类的情感与道德准则。本报告基于“心理学xAI”的交叉研究,聚焦人类共情与利他行为的发生发展规律和影响机制,结合儿童青少年的共情能力与利他行为培养方面的研究实践,为开发更具有同理心和利他性的AI提供启发,从而探索AI 价值对齐的新路径。通过系列实验任务发现,以Deepseek R1为代表的推理模型在公平感和道德惩罚方面已超越人类平均水平,并呈现出类人的“情绪-决策耦合效应”。然而,当前LLMs仍存在情绪变异度低、情绪惰性高等问题,容易在社会刻板印象方面形成放大效应,缺乏人类式的情感丰富度和弹性。通过解析“情绪 → 动机 → 决策”的作用机制,心理学为 LLM 的行为模拟提供了走向动机与价值内化的路线图。这一视角有望推动未来AI成为更具同理心、利他性与社会道德观,兼具认知与情感智能的协作伙伴。


Bio

伍珍

清华大学长聘副教授

伍珍,清华大学长聘副教授、博士生导师,清华大学心理与认知科学系副主任,清华大学终身学习实验室研究主管。曾获得北京市教学成果奖一等奖、清华大学“学术新人”奖、仲英青年学者、青年教师教学优秀奖、年度教学优秀奖、“课程思政”示范课程及示范教师等多个奖励和荣誉。研究领域为儿童青少年心理发展,已在国内外高水平期刊发表论文30多篇,担任国际知名期刊《Infant Behavior and Development》编委,担任中国心理学会普通心理学和实验心理学专业委员会及中国心理学会心理学教学指导委员会委员,中国认知科学学会社会认知分会理事,北京心理学会理事等。主持国家自然科学基金、教育科学规划重点课题等多个科研项目。


More info:

https://www.pcs.tsinghua.edu.cn/info/1009/1358.htm 


点击下方 关注我们

内容中包含的图片若涉及版权问题,请及时与我们联系删除