- 简介传统的非生成式深度学习模型通常难以解释股票预测,其解释仅限于可视化重要文本的注意力权重。今天,大型语言模型(LLMs)提供了解决这个问题的方案,因为它们已知能够生成人类可读的解释其决策过程的能力。然而,股票预测对LLMs来说仍然具有挑战性,因为它需要能够权衡混乱社交文本对股票价格的不同影响的能力。随着解释组件的引入,问题变得越来越困难,因为这要求LLMs口头解释为什么某些因素比其他因素更重要。另一方面,要为这样的任务微调LLMs,需要对训练集中每个股票运动的解释进行专家注释,这是昂贵且不切实际的。为了解决这些问题,我们提出了我们的Summarize-Explain-Predict(SEP)框架,它利用自反思代理和Proximal Policy Optimization(PPO),让LLM自我教导如何完全自主地生成可解释的股票预测。反思代理通过自我推理学习如何解释过去的股票运动,而PPO训练器则训练模型从输入文本中生成最可能的解释。PPO训练器的训练样本也是反思过程中生成的响应,这消除了人类注释员的需要。使用我们的SEP框架,我们微调了一个LLM,它在股票分类任务的预测准确性和Matthews相关系数方面均优于传统的深度学习和LLM方法。为了证明我们框架的泛化能力,我们进一步在组合构建任务上进行了测试,并通过各种组合指标展示了其有效性。
- 图表
- 解决问题本论文旨在解决股票预测中的解释性问题,提出了一种自我反思代理和PPO相结合的SEP框架,让LLM自主生成可解释的股票预测。
- 关键思路论文提出了一种自我反思代理和PPO相结合的SEP框架,通过自我反思学习解释过去的股票走势,PPO训练模型生成最可能的解释,同时省去了人工标注数据的成本。
- 其它亮点论文使用SEP框架对LLM进行fine-tune,能够在股票分类任务的预测准确性和Matthews相关系数方面优于传统深度学习和LLM方法。同时,论文还在投资组合构建任务上进行了测试,并展示了各种投资组合指标的有效性。
- 在这个领域中,最近的相关研究包括:'Interpretable Deep Learning for Portfolio Returns Prediction with Economic Constraints','Stock Price Prediction and Forecasting Using Stacked LSTM'等。
沙发等你来抢
去评论
评论
沙发等你来抢