Markowitz Meets Bellman: Knowledge-distilled Reinforcement Learning for Portfolio Management

简介

这篇论文介绍了一种混合方法，将马科维茨的投资组合理论与强化学习相结合，利用知识蒸馏来训练代理人，这对于金融领域中至关重要的投资组合平衡潜在回报和风险。特别地，我们提出的方法称为KDD（知识蒸馏DDPG），包括两个训练阶段：监督学习阶段和强化学习阶段。训练好的代理人优化投资组合的组合。通过与标准金融模型和AI框架进行比较分析，使用回报率、夏普比率和九个评估指标等指标，揭示了我们模型的优越性。它显著地实现了最高的收益率和夏普比率2.03，在可比的回报情况下确保了最高的盈利能力和最低的风险。
图表
解决问题

本文旨在通过结合马科维茨的投资组合理论和强化学习，利用知识蒸馏来训练代理，优化投资组合的构建，从而平衡潜在的回报和风险。
关键思路

本文提出了一种名为KDD（知识蒸馏DDPG）的混合方法，包括监督学习和强化学习两个阶段的训练。该方法相较于当前标准的金融模型和人工智能框架，使用收益率、夏普比率和九个评估指标等指标进行比较分析，表现出更高的收益率和夏普比率，确保在可比的回报情况下实现最高的盈利和最低的风险。
其它亮点

该模型在实验中表现出优异的性能，达到了最高的收益率和夏普比率，同时也具有较低的风险。本文提出的KDD方法还可以用于其他金融领域的决策优化问题。论文提供了开源代码和数据集。
相关研究

最近的相关研究包括：“Reinforcement Learning for Trading Systems and Portfolios”和“Portfolio Management with Reinforcement Learning”。

Markowitz Meets Bellman: Knowledge-distilled Reinforcement Learning for Portfolio Management

评论