【标题】A model-based hybrid soft actor-critic deep reinforcement learning algorithm for optimal ventilator settings

【作者团队】Shaotao Chen, Xihe Qiu, Xiaoyu Tan, Zhijun Fang, Yaochu Jin

【发表日期】2022.8.18

【论文链接】https://www.sciencedirect.com/science/article/abs/pii/S0020025522009112

【推荐理由】呼吸机设置包含连续(例如,频率)和离散参数(例如,通气模式),这使得传统的基于强化学习(RL) 的方法难以处理此类问题。同时,有必要开发数据效率高的模型,以克服医疗数据不足的问题。本文提出了一种基于模型的混合soft actor-critic(MHSAC)算法,该算法是基于经典的soft actor-critic(SAC)和基于模型的策略优化(MBPO)框架开发的。该算法可以根据患者生理信息的当前和预测状态学习连续和离散策略,数据效率高。结果表明,本文提出的模型显著优于基线模型,在 OpenAI Gym 模拟环境中实现卓越的效率和高精度。此模型能够解决混合动作空间问题,提高数据效率,加速收敛,可以生成实用的最佳呼吸机设置,最大限度地减少可能的医疗错误,并提供临床决策支持。

内容中包含的图片若涉及版权问题,请及时与我们联系删除