- 简介这项研究调查了OpenAI的ChatGPT-3.5和ChatGPT-4是否能够使用两种不同的提示策略准确预测未来事件。为了评估预测的准确性,我们利用实验时的训练数据停留在2021年9月,并使用ChatGPT-3.5和ChatGPT-4询问发生在2022年的事件。我们采用了两种提示策略:直接预测和我们称之为“未来叙述”,即要求ChatGPT讲述设定在未来的虚构故事,其中的角色分享了发生在他们身上的事件,但这些事件发生在ChatGPT的训练数据收集之后。我们集中关注2022年的事件,提示ChatGPT进行故事叙述,特别是在经济背景下。经过分析100个提示,我们发现未来叙述提示显著提高了ChatGPT-4的预测准确性。这在其对主要奥斯卡获奖者以及经济趋势的预测中尤为明显,后者是从模型扮演公众人物(如联邦储备委员会主席杰罗姆·鲍威尔)的情景中推断出来的。这些发现表明,叙述提示利用了模型构建幻觉叙述的能力,促进了比直接预测更有效的数据综合和外推。我们的研究揭示了LLMs预测能力的新方面,并提出了在分析环境中的潜在未来应用。
- 图表
- 解决问题本论文旨在探讨使用两种不同的提示策略,即直接预测和未来叙述,来评估OpenAI的ChatGPT-3.5和ChatGPT-4是否能够准确预测未来事件。论文试图验证这些模型的预测准确性,并探索未来叙述提示是否能够提高预测准确性。
- 关键思路本论文的关键思路是使用未来叙述提示来提高ChatGPT-4的预测准确性。相较于直接预测,未来叙述提示可以更好地利用模型的虚构叙事能力,从而更有效地进行数据综合和推断。
- 其它亮点论文使用了两种提示策略来评估模型的预测准确性,并发现未来叙述提示可以显著提高ChatGPT-4的预测准确性。实验集中在经济情境下的故事叙述,特别是在模拟联邦储备委员会主席杰罗姆·鲍威尔等公众人物时,ChatGPT-4的经济趋势预测表现出色。这些发现揭示了LLMs的预测能力的新方面,并提出了在分析背景下的潜在未来应用。
- 最近的相关研究包括使用LLMs进行预测的其他研究,如《GPT-3:自然语言生成的新里程碑》、《在大规模预训练语言模型中挖掘知识的方法》等。
沙发等你来抢
去评论
评论
沙发等你来抢