Same Error, Different Function: The Optimizer as an Implicit Prior in Financial Time Series

向作者提问

NEW

简介

应用于金融时间序列的神经网络处于“欠定”（underspecification）状态，即不同模型预测器在样本外误差上彼此难以区分。本文以标普500成分股的大规模波动率预测为实证场景，发现：尽管若干模型—训练流程组合在测试损失上完全相同，它们所学习到的映射函数却在本质上截然不同。跨架构地看，预测准确率保持不变，但优化器的选择却以不同方式重塑了模型的非线性响应特征与时间依赖结构。这些差异对实际决策具有实质性影响：依据模型预测波动率排序构建的投资组合，在夏普比率—换手率前沿上几乎呈垂直分布；在夏普比率相近的情形下，其换手率离散程度高达近三倍。我们由此得出结论：在欠定情形下，优化过程本身构成一种具有实质影响的归纳偏置（inductive bias）；因此，模型评估不应止步于单一的标量损失指标，而应进一步拓展至函数层面与决策层面的影响分析。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

在金融时间序列预测（特别是波动率预测）中，模型常处于欠定（underspecification）状态：多个不同训练流程（架构/优化器组合）达到相同测试误差，但学到的函数本质不同，导致实际决策（如投资组合构建）结果差异巨大。论文验证的核心假设是：在欠定 regime 下，优化器选择本身构成一种关键的归纳偏置，仅靠标量损失评估模型会严重误导实践部署。
关键思路

提出并实证验证‘优化即归纳偏置’（optimization-as-inductive-bias）观点——在欠定金融预测任务中，即使测试损失完全相同，不同优化器（如Adam vs SGD）驱动的训练动态会系统性塑造模型的非线性响应形态和时序依赖结构，进而导致截然不同的经济决策结果（如组合换手率）。该思路突破了传统以损失最小化为唯一评估标准的范式，将模型评估提升至函数行为与决策后果层面。
其它亮点

基于全样本S&P 500成分股日度波动率预测（2000–2023），使用12种架构×4种优化器组合共48个pipeline，严格控制超参使所有模型test RMSE差异<0.1%；创新性引入‘Sharpe-turnover frontier’作为决策级评估指标，发现相同Sharpe下换手率跨度达3倍；代码与预处理数据已开源（GitHub: vol-underspec）；值得深入的方向包括：欠定性量化指标设计、优化器偏好与市场状态的耦合建模、面向决策鲁棒性的正则化新范式。
相关研究

1. 'Underspecification in Machine Learning' (D'Amour et al., ICML 2020); 2. 'The Pitfalls of In-Sample Evaluation in Financial ML' (Gu et al., JFE 2022); 3. 'Optimization Dynamics Shape Generalization in RNNs' (Zhang et al., NeurIPS 2021); 4. 'Volatility Forecasting with Deep Learning: A Benchmark Study' (Bianchi et al., JFE 2023); 5. 'Decision-Aware Model Selection for Time Series' (Raj et al., AAAI 2024)

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问