深度强化学习(Deep Reinforcement Learning)是近年来人工智能领域备受关注的技术和方向之一,已在多个领域取得了显著的研究成果。如今,学术界和产业界纷纷开始尝试将深度强化学习应用于现实世界。在 AAAI 2021 被接收的论文中,微软亚洲研究院与上海交通大学合作在 AI+ 金融领域的最新研究工作《Universal Trading for Order Execution with Oracle Policy Distillation》就是尝试利用强化学习,来优化金融市场交易中订单执行(Order Execution)的问题。该工作在训练过程中引入了能利用未来信息的先知策略(Oracle Policy),通过策略蒸馏的方式,指导只能看到当前信息且在实际场景中最终使用的策略学到更优的交易策略。

研究员们在进行这项研究工作的尝试和迭代的同时,还积极构建了能更好地支持算法交易场景下强化学习研究的组件,使得研究思路得以在这个组件上快速方便地进行尝试和迭代,并为今后的研究课题打下了基础。该研究工作的部分相关代码目前已通过样例的形式在 Qlib 中开源,后续研究员们会将完整的支撑组件嵌入到 Qlib 中,旨在助力算法交易场景下各类问题的研究。

QLib:微软亚洲研究院于2020年9月开源的 AI 量化投资平台

感兴趣的可以戳原文。

内容中包含的图片若涉及版权问题,请及时与我们联系删除