- 简介本文研究人类和语言模型(LMs)之间的协作动态,其中交互通常涉及LM提出文本段落,人类编辑或回应这些建议。在这种情况下,与LMs的生产性接触需要人类辨别有效的基于文本的交互策略,例如历史人类-LM交互中的编辑和响应样式。这个目标本质上是因果关系,由反事实的“如果”问题驱动:如果人类采用不同的文本编辑/细化策略,协作的结果会如何改变?回答这个因果推断问题的一个关键挑战是制定适当的因果估计:传统的平均处理效应(ATE)估计因果效应不适用于基于文本的处理,因为它们具有高维度。为了解决这个问题,我们引入了一个新的因果估计量——增量风格效应(ISE),它表征了将文本微小地向特定风格(如增加正式性)移动的平均影响。我们建立了ISE的非参数识别条件。在此基础上,我们开发了CausalCollab算法,旨在估计动态人类-LM协作中各种交互策略的ISE。我们在三个不同的人类-LM协作场景中进行的实证研究表明,CausalCollab有效地减少了混淆,并显著提高了对一组竞争基线的反事实估计。
- 图表
- 解决问题论文旨在解决人类和语言模型在协作中的互动问题,即如何确定有效的文本交互策略,并提出了一种新的因果估计指标ISE。
- 关键思路论文提出了一种新的因果估计指标ISE,用于衡量将文本朝特定风格微调的平均影响,并开发了算法CausalCollab来估计各种交互策略的ISE。
- 其它亮点论文通过三个不同的人类-语言模型协作场景的实验验证了CausalCollab的有效性,并展示了其在降低混淆和显著提高反事实估计方面的优势。
- 与本文相关的研究包括因果推断、文本生成和编辑、人机交互等领域的研究,例如:'Counterfactual Fairness'、'Text Editing with Unsupervised Style Models'、'Interactive Language Generation with Coarse-to-Fine Polishing'等。
沙发等你来抢
去评论
评论
沙发等你来抢