为突破这一瓶颈,Meta团队及其合作者提出了自我参照智能体框架HyperAgents,进一步构建的DGM-H系统在四大跨领域任务中均实现性能提升,为开放式、跨域迁移的自改进AI提供了全新范式。
[让我看看]DGM-H:跨域元级能力改进
DGM-H 系统的运作包含两个交替阶段:
1️⃣元认知自我修正:将任务智能体与元智能体统一到一个可编辑程序中,连原本固定的元级改进机制也变成了可被优化的对象,从而实现真正的自我参照式改进。
2️⃣实证评估:对修改后的新智能体变体进行实际测试,随后将其重新添加到存档档案中,进一步地,DGM-H表现出元层改进的跨领域迁移与累积能力。
此外,DGM-H在迭代过程中,还自主涌现出了没有提前预设的元级能力。这些元级的改进,天然具备跨领域迁移、跨运行累积的特性。
[加油]实验结果
研究团队在多组实验上证实了DGM-H的通用自我进化能力。
1️⃣任务层面:DGM-H 在论文审阅测试集上从0提升至0.71,机器人奖励设计从0.06提升至0.372,在编程与多语言编程上,将其性能分别从20.0%提升至50.0%,从14.2%提升至30.7%;
2️⃣元能力层面:在各任务中完成优化的Hyperagents,迁移至完全未接触过的奥林匹克数学评分领域后,imp@50指标达到0.63,而手工设计DGM的迁移智能体该指标近乎为0;
3️⃣自我改进能力:迁移智能体启动的DGM-H在奥数评分上取得更高最终性能,证明其自我改进能力可跨领域、跨运行持续叠加。
通过定性分析,DGM-H自主发展出性能追踪、持久记忆、偏差检测、计算感知策略规划等元能力,使其能快速自我优化。
[鼓掌]局限与未来工作
当然,DGM-H也面临着局限与面临的安全挑战。
当前DGM-H在预定义任务上运行,无法自主生成和演化课程,开放式探索循环的部分组件(如父代选择、评估协议)仍保持不可修改这可能限制了真正无限的开放式进步。
研究团队表示,本次所有实验,均在严格设计的环境中运行,配合全流程的资源限制与人工监督。随着系统能力增强,如何在透明度、可控性与系统潜力之间取得平衡,是开放式自我改进系统需面对的核心挑战。
更多细节,请查看原论文。
整理:珏子
#大模型 #人工智能 #AI #自我进化 #Meta
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢