- 简介随着大型语言模型在关键应用中越来越普及,需要控制语言生成策略,既要具有计算效率,又要具有性能保证。为了实现这一目标,我们使用一个通用的概念语义模型,将其线性表示在语言模型的潜在空间中。特别地,我们认为自然语言生成在这个连续的语义空间中跟踪轨迹,由语言模型的隐藏激活实现。这种观点允许在潜在空间中对文本生成进行控制论处理,我们提出了一种轻量级、无梯度干预的方法,动态地将轨迹从对应于不希望出现的意义区域中转移开来。关键是,我们展示了这种干预是在概率上保证将输出引导到允许的区域。最后,我们通过一个避免毒性内容的目标演示了,这种干预可以将语言从不希望出现的内容中转移开来,同时保持文本质量。
- 图表
- 解决问题控制语言生成策略需要具备计算效率和性能保证。本文提出了在语言模型的潜在空间中线性表示的概念语义模型,并提出了一种轻量级、无梯度干预方法,可以动态地将语言生成的轨迹从不希望的含义区域中转移。研究旨在解决语言生成中的意义控制问题。
- 关键思路本文提出了一种基于潜在语义空间的控制论方法,通过线性表示概念语义模型,实现语言生成轨迹的控制。该方法可以保证在概率上将输出转移到允许区域。
- 其它亮点本文的方法可以实现语言生成中的意义控制,并且不需要梯度,非常轻量级。实验结果表明,该方法可以有效地将语言转移到允许区域,并保持文本质量。论文使用了毒性避免为目标的实验,并验证了方法的有效性。
- 最近在这个领域中,还有一些相关的研究,如:《Controllable Text Generation》、《Towards Controlled Generation of Text》等。
沙发等你来抢
去评论
评论
沙发等你来抢