- 简介电子表格操作在大多数日常工作中得到广泛应用,显著提高了工作效率。最近,人们尝试使用大型语言模型(LLM)进行自动电子表格操作,但尚未在存在推理挑战的复杂和现实任务中进行研究(例如,具有多步推理和模糊要求的长期操作)。为了弥合与实际需求之间的差距,我们引入了$\textbf{SheetRM}$,这是一个具有推理依赖操作的长期和多类任务的基准,这些操作由现实生活中的挑战引起。为了缓解上述挑战,我们进一步提出了$\textbf{SheetAgent}$,这是一个利用LLM的新型自主代理。SheetAgent由三个协作模块$\textit{Planner}$、$\textit{Informer}$和$\textit{Retriever}$组成,通过迭代任务推理和反思,实现了对电子表格的高级推理和准确操作,无需人为干预。广泛的实验表明,SheetAgent在多个基准测试中相对于基线提高了20-30%的通过率,实现了电子表格操作的增强精度,并展示了卓越的表格推理能力。更多详细信息和可视化内容可访问https://sheetagent.github.io。
-
- 图表
- 解决问题介绍了一种名为SheetRM的基准测试,用于评估长期和多类别任务的电子表格操作,以及解决多步推理和模糊要求等现实挑战。
- 关键思路提出了一种名为SheetAgent的自主代理,它由三个协作模块组成,利用LLMs的能力实现高级推理和准确操作,通过迭代任务推理和反思实现电子表格的自动操作。
- 其它亮点通过实验验证,SheetAgent在多个基准测试中相对于基线提高了20-30%的通过率,实现了电子表格操作的精度提升,并展示了卓越的表格推理能力。
- 最近的相关研究包括:'Towards Learning to Reason over Tables','Table-to-Text: Describing Table Region with Natural Language'和'Multi-Task Learning for Table Semantic Parsing'。
- 2
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流