- 简介AI社区一直在探索通过开发“语言代理”来实现人工通用智能(AGI)的路径,这些代理是复杂的大型语言模型(LLM)管道,涉及提示技术和工具使用方法。虽然语言代理在许多实际任务中展示了令人印象深刻的能力,但当前语言代理研究的一个根本限制是它们是模型中心或工程中心的。也就是说,提示、工具和管道的进展需要人类专家进行大量手动工程工作,而不是从数据中自动学习。我们认为,从模型中心或工程中心转向数据中心,即语言代理在环境中自主学习和演化的能力,是它们可能实现AGI的关键。 在这项工作中,我们介绍了代理符号学习,这是一个系统性框架,使语言代理能够以数据为中心使用符号优化器自我优化。具体而言,我们将代理视为符号网络,其中可学习的权重由提示、工具和它们的堆叠方式定义。代理符号学习旨在通过模仿连接主义学习中的两个基本算法:反向传播和梯度下降,来优化语言代理中的符号网络。代理符号学习不是处理数字权重,而是使用权重、损失和梯度的自然语言类比。我们在标准基准测试和复杂的实际任务上进行了概念验证实验,并展示了代理符号学习使语言代理能够在创建和部署后自我更新,从而产生“自我演化代理”。
- 图表
- 解决问题论文旨在解决当前语言代理研究中的一个基本限制,即模型中心化或工程中心化的问题,通过引入代理符号学习框架,使语言代理能够在数据中心化的方式下自主学习和进化,从而可能实现人工通用智能。
- 关键思路代理符号学习框架是一种系统性的方法,它通过模仿连接主义学习中的反向传播和梯度下降两种基本算法,将代理视为符号网络,并在符号优化器的帮助下对代理进行优化,从而实现代理的自我更新和进化。
- 其它亮点论文在标准基准测试和复杂的实际任务上进行了概念验证实验,并表明代理符号学习使语言代理能够在部署后自我更新,从而实现了“自我进化代理”。
- 近期在这个领域中的相关研究包括使用自监督学习方法进行预训练的大规模语言模型,如GPT和BERT,以及使用元学习方法进行快速自适应的语言模型,如MAML。
沙发等你来抢
去评论
评论
沙发等你来抢