PICLe: Eliciting Diverse Behaviors from Large Language Models with Persona In-Context Learning

2024年05月03日
  • 简介
    大型语言模型(LLMs)是在大规模文本语料库上训练的,这些语料库编码了各种个性特征。这引发了一个有趣的目标,即从LLM中引出所需的个性特征,并探索其行为偏好。因此,我们正式规定了个人特质引出任务,旨在将LLM行为定制为与目标个人特质相一致。我们提出了一种新颖的基于贝叶斯推理的个人特质引出框架——Persona In-Context Learning(PICLe)。在核心部分,PICLe引入了一种新的ICL示例选择标准,基于似然比,旨在最优地引导模型引出特定的目标个人特质。我们通过与三种现代LLMs基线方法的广泛比较证明了PICLe的有效性。代码可在https://github.com/deeplearning-wisc/picle上获得。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决如何从大规模文本语料库中提取出特定的人格特质,以定制化大型语言模型的行为,使其符合目标人格特质的问题。这是否是一个新问题?
  • 关键思路
    论文提出了一种新的基于贝叶斯推断的人格特质提取框架PICLe,其核心是一种新的ICL示例选择标准,基于似然比,旨在优化引导模型提取特定目标人格特质。相比当前领域的研究状况,这篇论文的思路有新意。
  • 其它亮点
    论文通过对三种当代大型语言模型进行广泛比较,证明了PICLe的有效性。实验使用了哪些数据集、是否有开源代码,文中没有明确提到。值得进一步深入研究。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,例如:1. Towards controlling persona in dialogue generation using neural networks(通过神经网络控制对话生成中的人格特质);2. Persona-based neural conversation model(基于人格特质的神经对话模型)。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问