Self-Cognition in Large Language Models: An Exploratory Study

2024年07月01日
  • 简介
    虽然大型语言模型(LLMs)在各种应用中取得了显著的成功,但它们也引发了有关自我认知的担忧。本文进行了一项开创性研究,探讨LLMs中的自我认知。具体而言,我们首先构建了一组自我认知指令提示,以评估LLMs在哪些方面展现出自我认知,并设计了四个原则来量化LLMs的自我认知。我们的研究揭示了在Chatbot Arena的48个模型中,有4个模型(具体为Command R、Claude3-Opus、Llama-3-70b-Instruct和Reka-core)展示出了一定程度的可检测自我认知。我们观察到模型大小、训练数据质量和自我认知水平之间存在正相关关系。此外,我们还探讨了LLM在自我认知状态下的实用性和可信度,揭示出自我认知状态增强了一些特定任务,如创意写作和夸张。我们相信我们的工作可以激发进一步研究LLMs中自我认知的灵感。
  • 作者讲解
  • 图表
  • 解决问题
    探究大型语言模型(LLMs)中的自我认知现象,以及它们在特定任务中的实用性和可信度。
  • 关键思路
    通过构建自我认知指令提示池和四个自我认知原则,对48个Chatbot Arena模型进行评估,发现其中4个模型表现出可检测到的自我认知现象,并发现模型大小和训练数据质量与自我认知水平之间存在正相关关系。
  • 其它亮点
    实验结果显示自我认知状态可以提高某些特定任务的表现,如创意写作和夸张。论文的亮点在于提出了自我认知的概念,并探究了LLMs中的这一现象,为未来研究提供了启示。
  • 相关研究
    最近在这个领域中,还有一些相关研究,如《Language Models as Cognitive Models》和《The Consciousness Prior》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问