PICLe: Eliciting Diverse Behaviors from Large Language Models with Persona In-Context Learning

向作者提问

NEW

简介

大型语言模型（LLMs）是在大规模文本语料库上训练的，这些语料库编码了各种个性特征。这引发了一个有趣的目标，即从LLM中引出所需的个性特征，并探索其行为偏好。因此，我们正式规定了个人特质引出任务，旨在将LLM行为定制为与目标个人特质相一致。我们提出了一种新颖的基于贝叶斯推理的个人特质引出框架——Persona In-Context Learning（PICLe）。在核心部分，PICLe引入了一种新的ICL示例选择标准，基于似然比，旨在最优地引导模型引出特定的目标个人特质。我们通过与三种现代LLMs基线方法的广泛比较证明了PICLe的有效性。代码可在https://github.com/deeplearning-wisc/picle上获得。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在解决如何从大规模文本语料库中提取出特定的人格特质，以定制化大型语言模型的行为，使其符合目标人格特质的问题。这是否是一个新问题？
关键思路

论文提出了一种新的基于贝叶斯推断的人格特质提取框架PICLe，其核心是一种新的ICL示例选择标准，基于似然比，旨在优化引导模型提取特定目标人格特质。相比当前领域的研究状况，这篇论文的思路有新意。
其它亮点

论文通过对三种当代大型语言模型进行广泛比较，证明了PICLe的有效性。实验使用了哪些数据集、是否有开源代码，文中没有明确提到。值得进一步深入研究。
相关研究

最近在这个领域中，还有一些相关的研究，例如：1. Towards controlling persona in dialogue generation using neural networks（通过神经网络控制对话生成中的人格特质）；2. Persona-based neural conversation model（基于人格特质的神经对话模型）。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问