- 简介本文利用深度强化学习(DRL)对美式看跌期权进行对冲,使用深度确定性策略梯度(DDPG)方法。首先使用几何布朗运动(GBM)资产路径对代理进行训练和测试,并展示了超越传统策略(如Black-Scholes(BS)Delta)的卓越表现,特别是在交易成本存在的情况下。为了评估DRL对冲的实际适用性,第二轮实验使用市场校准的随机波动率模型来训练DRL代理。具体而言,收集了8个符号的80个看跌期权,为每个符号校准了随机波动率模型系数,并通过模拟各自校准模型的路径来训练了80个期权的DRL代理。当使用相同的校准随机波动率模型数据进行测试时,DRL代理不仅优于BS Delta方法,而且在对冲期权出售日期和到期之间发生的真实资产路径时,DRL代理也取得了更好的结果。因此,这项研究不仅提出了首个针对美式看跌期权对冲的DRL代理,而且在模拟和实证市场测试数据上的结果也表明,DRL代理在实际情况下优于BS Delta方法。最后,注意本研究采用了一种模型无关的Chebyshev插值方法,为DRL代理在使用随机波动率模型时提供每个时间步的期权价格,从而为更复杂的基础资产过程提供了一个通用框架的扩展。
- 图表
- 解决问题本论文旨在利用深度强化学习(DRL)和深度确定性策略梯度(DDPG)方法对美式看跌期权进行对冲,以验证其在真实市场环境下的优越性。
- 关键思路论文提出了一种基于DRL的对冲方法,相较于传统的Black-Scholes(BS)Delta方法,在模拟和实际市场测试中均表现出更好的效果。
- 其它亮点论文通过使用几何布朗运动(GBM)和随机波动率模型进行模拟,证明了该方法的优越性。同时,论文提出的Chebyshev插值方法可以使DRL代理在使用随机波动率模型时获得每个时间步的期权价格。最后,该研究为进一步研究提供了一个通用框架。
- 最近的相关研究包括:'Deep Hedging','A Deep Reinforcement Learning Framework for the Financial Portfolio Management Problem','Deep Learning Volatility'等。
沙发等你来抢
去评论
评论
沙发等你来抢