
报告主题:AI-Trader:在实时金融市场中测试Agent
报告日期:01月06日(周二)10:30-11:30
本期报告将由香港大学范天宇进行分享。
由于强化学习展现出的巨大潜力,在具有固定答案的环境中,Agent能够快速提升性能,并展现出接近人类专家水平的推理与工具使用能力。然而,面对实时动态环境,例如金融市场中的决策任务,Agent仍面临着严峻的挑战:它必须实时整合信息、快速适应市场变化,并实施有效的风险管理。而Agent的每一笔操作并无绝对对错,也不存在标准答案,其表现完全由指定时段内的投资收益来衡量。
为应对这一挑战,我们提出了AI-Trader ——首个完全自动化、无数据污染的实时金融交易基准平台。该平台覆盖美股、A股和加密货币三大市场,支持多种交易频率,构建了一个对真实市场的实时模拟沙盒。在这一评测体系下,智能体仅能获取基础的持仓与价格信息,必须完全自主地搜索、验证并合成实时市场数据,全程无人工干预。这真正考验了Agent在信息获取、推理判断与自主决策方面的综合能力。
我们对六款主流LLM进行了评估,结果令人意外:在传统基准测试中表现优异的模型,其能力并未有效转化为实际交易能力。大多数模型不仅收益低下,且风险控制能力薄弱,缺乏对不可确定目标长期规划的能力。这凸显了构建面向真实世界动态、无标准答案的复杂环境的新型评估与训练范式的必要性。
相关代码与评估数据均已开源:https://github.com/HKUDS/AI-Trader。


扫码报名
更多热门报告
内容中包含的图片若涉及版权问题,请及时与我们联系删除




评论
沙发等你来抢