SheetAgent: A Generalist Agent for Spreadsheet Reasoning and Manipulation via Large Language Models

简介

电子表格操作在大多数日常工作中得到广泛应用，显著提高了工作效率。最近，人们尝试使用大型语言模型（LLM）进行自动电子表格操作，但尚未在存在推理挑战的复杂和现实任务中进行研究（例如，具有多步推理和模糊要求的长期操作）。为了弥合与实际需求之间的差距，我们引入了$\textbf{SheetRM}$，这是一个具有推理依赖操作的长期和多类任务的基准，这些操作由现实生活中的挑战引起。为了缓解上述挑战，我们进一步提出了$\textbf{SheetAgent}$，这是一个利用LLM的新型自主代理。SheetAgent由三个协作模块$\textit{Planner}$、$\textit{Informer}$和$\textit{Retriever}$组成，通过迭代任务推理和反思，实现了对电子表格的高级推理和准确操作，无需人为干预。广泛的实验表明，SheetAgent在多个基准测试中相对于基线提高了20-30%的通过率，实现了电子表格操作的增强精度，并展示了卓越的表格推理能力。更多详细信息和可视化内容可访问https://sheetagent.github.io。
作者讲解·2
- 讲解视频
- 相关报道(2)
图表
解决问题

介绍了一种名为SheetRM的基准测试，用于评估长期和多类别任务的电子表格操作，以及解决多步推理和模糊要求等现实挑战。
关键思路

提出了一种名为SheetAgent的自主代理，它由三个协作模块组成，利用LLMs的能力实现高级推理和准确操作，通过迭代任务推理和反思实现电子表格的自动操作。
其它亮点

通过实验验证，SheetAgent在多个基准测试中相对于基线提高了20-30%的通过率，实现了电子表格操作的精度提升，并展示了卓越的表格推理能力。
相关研究

最近的相关研究包括：'Towards Learning to Reason over Tables'，'Table-to-Text: Describing Table Region with Natural Language'和'Multi-Task Learning for Table Semantic Parsing'。

SheetAgent: A Generalist Agent for Spreadsheet Reasoning and Manipulation via Large Language Models

提问交流

提问交流