Agent Lightning: Adding reinforcement learning to AI agents without code rewrites

AI代理正在改变软件开发，但在复杂多步任务中易出错。强化学习（RL）虽能提升代理性能，但通常需大量重写代码，限制了其应用。为此，微软亚洲研究院—上海团队推出开源框架Agent Lightning，通过分离任务执行与模型训练，使开发者无需修改代码即可为AI代理集成RL功能。该框架可自动记录代理行为数据，构建高质量轨迹用于RL训练，显著降低技术门槛。实验表明，经RL优化的代理在数学推理、代码生成等任务中表现更优，且支持多种模型与环境。Agent Lightning推动了智能代理的自我进化能力，加速了AI代理在实际场景中的落地应用，具有广泛前景。

本专栏通过快照技术转载，仅保留核心内容