强化学习(RL)早已被广泛应用于医疗保健、游戏竞技等实际生活场景中,但它的训练通常需要花费很长的时间。近日,来自奥地利维也纳大学的一组研究人员巧妙地运用量子技巧实现了对处理涉及光子的任务的显著提速。

这项研究于3月10日以「强化学习实验智能体中的量子加速」(Experimental quantum speed-up in reinforcement learning agents)为题发表在《自然》(Nature)杂志上。论文的主要作者是奥地利维也纳大学物理系教授、维也纳量子科学技术中心研究员瓦莱里亚·萨焦(Valeria Saggio)。

目前受量子力学启发的Advantageous RL算法已成功解决了量子信息处理中的问题,但与其他RL算法一样训练耗时良久,与量子计算的速度不匹配。

论文作者Saggio和她的同事们决定在训练中加入量子扭曲,以加快这一进程。他们设计了一个实验,让光子穿过波导并最终进入四种可能状态中的一种,通过给智能体布置任务并设置奖励,确保光子最终处于一种特定的目标状态。实验结果显示,他们的策略将RL的学习时间缩短了63%,从平均270次的猜测缩短到了100次。

内容中包含的图片若涉及版权问题,请及时与我们联系删除