强化学习是当前人工智能领域研究的热点之一,为了帮助研究与工程人员了解这一领域的进展和资讯,我们强化学习社区团队整理了第1期强化学习周刊,从论文推荐、研究动态、热点讨论、学术会议等几个维度推荐近期强化学习领域值得关注的信息。周刊采用社区协作的模式产生,欢迎感兴趣的朋友们参与我们的工作,一起来推动强化学习社群的分享、学习和交流活动。可以扫描文末的二维码加入强化学习社区群。 本期贡献者:任黎明 常政
论文推荐
强化学习近些年在医疗、游戏竞技、决策智能等领域取得了相当大的突破,比如超越人类玩家平均水平的DQN算法,以及碾压所有人类选手的Alpha Go等。本期推荐五篇强化学习相关论文,具体方向分别是无人机避障、计算效率提升、解决组合强化学习问题、遥感应用、无人机多目标搜索和检测、自动驾驶、医疗图像。
标题:A Vision Based Deep Reinforcement Learning Algorithm for UAV Obstacle Avoidance(基于视觉深度强化学习的无人机避障) 简介:针对于传统算法在无人机避障探索中总是获得稀少奖励的问题。本文应用深度强化学习改进无人机避障探索中的平均奖励。 论文地址:https://arxiv.org/pdf/2103.06403.pdf 点击这里阅读详细内容
标题:Improving Computational Efficiency in Visual Reinforcement Learning via Stored Embeddings(通过存储的嵌入提高视觉强化学习中的计算效率) 简介:本文提出了用于有效强化学习(SEER)的存储嵌入,通过减少CNN中梯度更新的计算开销,存储低维潜在矢量来减少内存需求来提高强化学习的计算效率。 论文地址:https://arxiv.org/pdf/2103.02886.pdf 点击这里阅读详细内容
标题:Solving Compositional Reinforcement Learning Problems via Task Reduction(通过任务减少解决组合强化学习问题) 简介:SIR利用任务减少功能来利用任务空间中的组成结构,并执行模仿学习,以有效地连续处理更具挑战性的任务。其有效地学习复杂的策略,以应对稀疏奖励连续控制问题。 论文地址:https://arxiv.org/pdf/2103.07607.pdf 点击这里阅读详细内容
标题:Deep Reinforcement Learning for Band Selection in Hyperspectral Image Classification(高光谱图像分类中波段选择的深度强化学习) 简介:本文首次提出了一种用于无监督高光谱波段选择的深度强化学习模型。并并展示了深度强化学习在遥感应用中的巨大潜力。 论文地址:https://arxiv.org/pdf/2103.08741.pdf 点击这里阅读详细内容
标题:Decentralized Reinforcement Learning for Multi-Target Search and Detection by a Team of Drones(无人机团队进行分散式强化学习以进行多目标搜索和检测) 简介:本文提出了一种多主体深度强化学习(MADRL)方法来协调一组飞行器(无人机),以解决具有挑战性的多目标搜索和检测的现实世界问题。 论文地址:https://arxiv.org/pdf/2103.09520.pdf 点击这里阅读详细内容
标题:Integrated Decision and Control: Towards Interpretable and Efficient Driving Intelligence(集成决策与控制:迈向可解释和高效的驾驶智能) 简介:本文提出了一个可解释且有效的自动驾驶车辆决策和控制框架,该框架具有较高的在线计算效率,且在不同的驾驶任务之间具有很好的可解释性和适应性。 论文地址:https://arxiv.org/pdf/2103.10290.pdf 点击这里阅读详细内容
标题:Image Synthesis for Data Augmentation in Medical CT using DeepReinforcement Learning(基于深度强化学习的医学CT数据增强图像合成) 简介:本文提出了一种集成样式转换(ST)方法和深度强化学习(DRL)方法,以克服训练神经网络所需的各种图像数据可用性很差的瓶颈。 论文地址:https://arxiv.org/pdf/2103.10493.pdf 点击这里阅读详细内容
研究动态
奥地利学者用「量子扭曲」加速强化学习 近日,来自奥地利维也纳大学的一组研究人员巧妙地运用量子技巧实现了对处理涉及光子的任务的显著提速。并将研究成果发表在近期《自然》(Nature)杂志上。目前受量子力学启发的Advantageous RL算法已成功解决了量子信息处理中的问题,但与其他RL算法一样训练耗时良久,与量子计算的速度不匹配。于是论文作者决定在训练中加入量子扭曲,以加快这一进程。 论文链接: https://www.nature.com/articles/s41586-021-03242-7 点击这里阅读详细内容
热点讨论
强化学习推荐系统的模型结构与特点总结 提到强化学习,似乎总给人一种难以训练且难以落地的感觉。但是听大佬说,企业里强化学习推荐系统(RLRS)落地的例子其实已经有不少,不过一般都没有公开细节。本文根据现有公开且知名的RLRS技术,总结出一些RLRS的通用性的规则或做法,并指出一些RLRS流程中存在的问题。 点击这里阅读详细内容
强化学习的“神话”和“鬼话” 强化学习发展很多年了,尤其近年,有很多论文出来。根据多年的经验,碰到了很多RL的“神话”(Myths)和“鬼话”(Misconceptions)。这个讲座分两部分。首先鸟瞰一下RL,讨论一下,1)要不要学习RL,2)RL是不是有很多问题,3)RL与相邻学科的关系如何。然后讨论一些“Meta consideration”(超越RL的思考)。 点击这里阅读详细内容
学术会议
中科院科学院自动化研究所 | 强化学习与运筹优化前沿技术论坛03月27日召开 由中科院科学院自动化研究所举办的“强化学习与运筹优化前沿技术论坛”将在03月27日召开,采用线上直播互动形式。中科院科学院自动化研究所所长徐波担任论坛主席,来自达摩院、华为、滴滴、腾讯、字节跳动等报告嘉宾,他们将基于强化学习,从整数规划、网约车优化、游戏AI、深度强化学习挑战等理论和应用角度作主题报告。 点击这里阅读详细内容
如果你正在从事或关注强化学习研究、实现与应用,欢迎加入“智源社区-强化学习-交流群”。在这里,你可以:
- 学习前沿知识、求解疑难困惑
- 分享经验心得、展示风貌才华
- 参与专属活动、结识研究伙伴
![]()
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢