Is Temperature the Creativity Parameter of Large Language Models?

2024年05月01日
  • 简介
    大型语言模型(LLMs)被应用于各种创意任务,它们的输出从美丽、奇特、拼贴到简单的抄袭不等。LLM的温度参数调节随机性的大小,导致更多样化的输出;因此,它经常被认为是创造力参数。在这里,我们使用预定的固定上下文、模型和提示进行叙事生成任务,来调查这一说法。具体而言,我们使用叙事生成中的四个必要条件:新颖性、典型性、凝聚力和连贯性,对不同温度值下的LLM输出进行实证分析。我们发现,温度与新颖性弱相关,与不连贯性适度相关,但与凝聚力和典型性没有关系。然而,温度对创造力的影响比“创造力参数”说法所暗示的更微妙和弱;总体结果表明,LLM在温度越高时生成的输出略微更具新颖性。最后,我们讨论了允许更多受控制的LLM创造力的想法,而不是依靠改变温度参数的机会性。
  • 图表
  • 解决问题
    探讨大型语言模型中温度参数对创造性的影响。
  • 关键思路
    通过四个创造性条件(新颖性、典型性、连贯性和一致性)来分析温度参数对大型语言模型生成的叙事文本的影响,并发现温度参数与新颖性有弱相关性,但与连贯性和典型性无关。
  • 其它亮点
    论文进行了实证分析,使用了预定的上下文、模型和提示,评估了大型语言模型在不同温度值下生成的叙事文本的创造性。结果表明,温度参数对创造性的影响比“创造性参数”所声称的更微妙和弱。研究者提出了一些控制大型语言模型创造性的想法,而不是仅依靠改变温度参数。
  • 相关研究
    近期的相关研究主要集中在大型语言模型的应用和改进上,如GPT-3等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论