- 简介这篇论文介绍了一种混合方法,将马科维茨的投资组合理论与强化学习相结合,利用知识蒸馏来训练代理人,这对于金融领域中至关重要的投资组合平衡潜在回报和风险。特别地,我们提出的方法称为KDD(知识蒸馏DDPG),包括两个训练阶段:监督学习阶段和强化学习阶段。训练好的代理人优化投资组合的组合。通过与标准金融模型和AI框架进行比较分析,使用回报率、夏普比率和九个评估指标等指标,揭示了我们模型的优越性。它显著地实现了最高的收益率和夏普比率2.03,在可比的回报情况下确保了最高的盈利能力和最低的风险。
- 图表
- 解决问题本文旨在通过结合马科维茨的投资组合理论和强化学习,利用知识蒸馏来训练代理,优化投资组合的构建,从而平衡潜在的回报和风险。
- 关键思路本文提出了一种名为KDD(知识蒸馏DDPG)的混合方法,包括监督学习和强化学习两个阶段的训练。该方法相较于当前标准的金融模型和人工智能框架,使用收益率、夏普比率和九个评估指标等指标进行比较分析,表现出更高的收益率和夏普比率,确保在可比的回报情况下实现最高的盈利和最低的风险。
- 其它亮点该模型在实验中表现出优异的性能,达到了最高的收益率和夏普比率,同时也具有较低的风险。本文提出的KDD方法还可以用于其他金融领域的决策优化问题。论文提供了开源代码和数据集。
- 最近的相关研究包括:“Reinforcement Learning for Trading Systems and Portfolios”和“Portfolio Management with Reinforcement Learning”。
沙发等你来抢
去评论
评论
沙发等你来抢