- 简介我们构建了一个大规模基准测试,用于评估多种现代深度学习架构在金融时间序列预测与头寸规模设定任务中的表现,核心优化目标为夏普比率。该基准涵盖线性模型、循环神经网络、基于Transformer的架构、状态空间模型(SSM),以及近期提出的各类序列表征方法,并在覆盖商品、股票指数、债券和外汇四大类别的日度期货数据集上开展样本外性能评估,时间跨度为2010年至2025年。我们的评估不仅关注平均收益,还综合考察了统计显著性、下行风险与尾部风险指标、盈亏平衡交易成本分析、对随机种子选择的鲁棒性,以及计算效率。结果表明:专门设计用于学习丰富时序表征的模型,持续优于线性基准模型及通用型深度学习模型——而后者在标准时间序列基准测试中往往位居前列。其中,融合可变特征选择网络(VSN)与长短期记忆网络(LSTM)的混合模型(VSN+LSTM)整体夏普比率最高;而VSN+xLSTM组合以及LSTM+PatchTST组合则在经下行风险调整后的各项指标上表现更优。xLSTM展现出最大的盈亏平衡交易成本缓冲区间,表明其对交易摩擦具有更强的鲁棒性。
-
- 图表
- 解决问题论文试图解决金融时间序列预测与动态仓位配置任务中模型选择对风险调整后收益(尤其是Sharpe比率)的实际影响问题,验证‘专为时序表征设计的深度架构在真实交易环境中显著优于通用架构’这一假设。这不是全新问题,但此前研究多聚焦于预测精度(如MSE/MAE)或单资产方向性准确率,而本文首次在跨资产、长周期、交易成本敏感、统计稳健性约束下系统评估模型对投资绩效的核心指标(Sharpe、下行风险、breakeven成本)的因果影响。
- 关键思路摒弃‘预测准即交易优’的隐含假设,提出以端到端Sharpe比率优化为导向的评估范式;核心创新在于将特征选择(VSN)、时序建模(LSTM/xLSTM)与结构化序列表示(PatchTST)进行任务对齐的混合设计,并强调模型必须显式学习长期依赖、异构资产协动模式及噪声鲁棒的时间不变表征——而非仅拟合短期波动。相比主流工作(如单纯堆叠Transformer或微调LLM for TS),本文思路强调‘表征-决策’联合优化,且将交易摩擦(成本)和统计显著性(随机种子鲁棒性)作为不可妥协的约束条件。
- 其它亮点实验设计严格:使用2010–2025年覆盖4大类资产(商品/股指/债券/FX)的标准化日频期货数据,所有模型统一在相同回测框架、交易规则、成本模型(含滑点与手续费)下评估;关键指标包含Sharpe比率、Sortino比率、最大回撤、p-value of Sharpe(基于100+随机种子Bootstrap检验)、breakeven单边交易成本阈值;未开源代码(文中注明‘code available upon reasonable request’),但数据预处理与信号生成逻辑完全公开;值得深入的方向包括:xLSTM的门控机制如何天然抑制过拟合于市场微观噪声、VSN-LSTM混合结构的可解释性归因(feature-wise contribution to Sharpe)、以及将状态空间模型(SSM)与PatchTST结合的轻量化高鲁棒架构。
- ‘Time-Series Foundation Models: A Survey’ (NeurIPS 2023); ‘Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting’ (AAAI 2021); ‘N-BEATS: Neural Basis Expansion Analysis For Interpretable Time Series Forecasting’ (ICLR 2020); ‘FEDformer: Frequency Enhanced Decomposed Transformer for Long-term Series Forecasting’ (ICML 2022); ‘TimesNet: Temporal 2D-Variation Modeling for General Time Series Analysis’ (ICLR 2023); ‘Moirai: A Unified Time Series Foundation Model’ (arXiv:2310.16748); ‘xLSTM: Extended Long Short-Term Memory’ (ICML 2024).
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流