
EMNLP 2025

EMNLP 2025, The 2025 Conference on Empirical Methods in Natural Language Processing, 计算机语言学和自然语言处理领域的顶级国际会议,是CCF推荐的B类国际学术会议,在相关领域享有较高的学术声誉。EMNLP 2025 计划于2025年11月5日至11月9日在中国江苏苏州召开。
近日,EMNLP 2025公布了论文录用结果。复旦大学数据智能与社会计算实验室共3篇论文被录用,其中1篇主会长文,1篇Findings长文、1篇主会短文。
UI-Hawk: Unleashing the Screen Stream Understanding for Mobile GUI Agents
作者:张霁雯,余亚奇,廖明辉,李文涛,吴觊豪,魏忠钰
类别:主会长文
合作单位:华为技术有限公司
摘要:图形用户界面(Graphical User Interface, GUI)智能体需要能够在数字设备的屏幕上进行精确操作。现有的 GUI 智能体仅依赖当前的视觉观测和纯文本的动作历史,而忽视了历史屏幕的重要性。为解决这一问题,我们提出了 UI-Hawk,一种专门设计用于处理 GUI 导航过程中屏幕序列的多模态 GUI 智能体。UI-Hawk 引入了一个具备历史感知能力的视觉编码器,以及一个高效的重采样模块,用于处理屏幕序列。为了更好地理解屏幕流,我们定义了四个基本任务,并开发了一种自动化数据构建方法,用于生成 UI-Hawk 的相应训练数据。与此同时,我们创建了一个双语测试基准 FunUI,以定量评估多模态大语言模型(MLLMs)对屏幕理解的基础能力。在 FunUI 以及多个 GUI 导航基准上的大量实验结果一致验证了:理解屏幕序列对于 GUI 任务至关重要。

EcoLANG: Efficient and Effective Agent Communication Language Induction for Social Simulation
作者:牟馨忆,钱忱,刘维,严岭, 胡尧, 黄萱菁,魏忠钰
类别:Findings长文
合作单位:上海交通大学,伦敦国王学院,小红书
摘要:大语言模型(LLMs)已经展现出模拟复杂社会动态的潜力。然而,大规模基于LLM的模拟仍然面临时间和计算成本高昂的重大挑战。我们观察到,当前LLM驱动的智能体的沟通中存在冗余:在表达相同意图时,智能体往往使用冗长且重复的语言,而人类则更倾向于使用最少的精力进行简洁的表达。为此,我们提出 EcoLANG:一种用于社会模拟的高效且有效的智能体沟通语言诱导方法。受人类语言在语言使用、社会互动中不断演化的启发,我们通过在词汇层面识别并保留核心交流概念,并在句子层面通过自然选择演化出高效的表达模式,从而诱导出一种更加紧凑的语言。我们将这种诱导出的语言应用于多种社会模拟中。实验结果表明,EcoLANG 在不牺牲模拟精度的前提下,大幅提升了效率,将 token 消耗降低了20%以上。

SocioBench: Modeling Human Behavior in Sociological Surveys with Large Language Models
作者:王嘉,赵子瑜,倪婷珺陶,魏忠钰
类别:主会短文
合作单位:上海创智学院,同济大学,浙江大学,上海交通大学
摘要:大型语言模型(LLM)在模拟人类社会行为与交互方面展现出良好前景,但在评估其与现实社会态度对齐程度时,仍缺乏大规模、系统构建的评测基准。为弥补这一空白,我们提出了SocioBench—一个源自ISSP [The International Social Survey Programme,这是一个历史悠久的跨国合作项目,由GESIS (Leibniz Institute for the Social Sciences,莱布尼茨社会科学研究所)每年收集的标准化社会调查问卷数据] 的全面基准。该基准汇集了来自30余个国家、覆盖10个社会学议题、包含40余项人口统计学属性标签的48万余条真实受访者调查记录。实验结果显示,当前主流开源、闭源LLMs在复杂的社会调查场景中模拟个体时,准确率仅为30%-40%,且对于不同议题与不同人口子群存在显著性差异。表明当前LLM在社会调查场景下存在个体数据不足,场景丰富度不够,群体建模缺失等问题。

\ | /
★
复旦大学数据智能与社会计算实验室
Fudan DISC
联系方式:disclab@fudan.edu.cn
地址:复旦大学邯郸校区计算中心
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢