【标题】Automatic Collective Motion Tuning Using Actor-Critic Deep Reinforcement Learning
【作者团队】Shadi Abpeikar, Kathryn Kasmarik, Matthew Garratt, Robert Hunjet
【发表日期】2022.5.6
【论文链接】https://www.sciencedirect.com/science/article/pii/S2210650222000554
【推荐理由】集体行为,如自主智能体的群体形成,提供了高效移动、冗余的优势,以及人类引导单个群体生物体的潜力。然而,很难调整一组智能体的行为,使其群集。行为引导算法允许智能体根据其物理形式和相关的运动约束自我调整行为。本文提出了一个强化学习框架,从随机行为中调整集体运动行为。学习过程由一个新的奖励函数来指导,该函数能够从传感器数据中自动检测到关于相邻智能体的相对速度和位置的一般集体运动行为。奖励函数是使用在人类标记的集体运动数据集上训练的元学习设计的。本文的强化学习器可以调整随机移动群体的行为,从而产生结构化的集体运动。通过与现有的发展进化框架比较表明,该学习框架可以更快地生成具有不同集体运动特征的行为。此外,经过训练的强化学习器可以调整机器人的行为,使其具有未经训练的运动特征。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢