- 简介本文提出了一种新的框架,用于模型学习和预测控制的集成,适用于高效的优化算法。具体而言,我们从一个ReLU神经模型的系统动力学开始,通过逐步稀疏化来删除冗余神经元,同时最小化预测准确度的损失。这个离散稀疏化过程被近似为一个连续问题,从而实现了模型架构和权重参数的端到端优化。稀疏化模型随后被混合整数预测控制器使用,该控制器将神经元激活表示为二进制变量,并采用高效的分支定界算法。我们的框架适用于各种DNN,从简单的多层感知器到复杂的图形神经动力学。它可以有效地处理涉及复杂接触动力学的任务,如物体推动、组合物体排序和可变形物体的操作。数值和硬件实验表明,尽管进行了激进的稀疏化,我们的框架仍然可以比现有的最先进方法提供更好的闭环性能。
- 图表
- 解决问题论文提出了一个新的框架,用于集成模型学习和预测控制,以便于有效的优化算法。该框架适用于各种DNNs,并且能够处理涉及复杂接触动力学的任务。
- 关键思路论文的关键思路是使用ReLU神经模型来描述系统动力学,并通过逐渐稀疏化来优化模型结构和权重参数。稀疏化过程被近似为一个连续问题,并由混合整数预测控制器使用。控制器将神经元激活表示为二进制变量,并采用高效的分支定界算法。
- 其它亮点论文的实验涉及到复杂的接触动力学任务,如物体推动、组合物体排序和可变形物体的操作。实验结果表明,尽管采用了激进的稀疏化方法,该框架仍能比现有的最先进方法提供更好的闭环性能。
- 最近在这个领域中,还有一些相关的研究,如《Learning to Optimize》、《Differentiable MPC》和《Neural Network Dynamics for Model-Based Deep Reinforcement Learning with Model-Free Fine-Tuning》等。
沙发等你来抢
去评论
评论
沙发等你来抢