SheetAgent: A Generalist Agent for Spreadsheet Reasoning and Manipulation via Large Language Models

2024年03月06日
  • 简介
    电子表格操作在大多数日常工作中得到广泛应用,显著提高了工作效率。最近,人们尝试使用大型语言模型(LLM)进行自动电子表格操作,但尚未在存在推理挑战的复杂和现实任务中进行研究(例如,具有多步推理和模糊要求的长期操作)。为了弥合与实际需求之间的差距,我们引入了$\textbf{SheetRM}$,这是一个具有推理依赖操作的长期和多类任务的基准,这些操作由现实生活中的挑战引起。为了缓解上述挑战,我们进一步提出了$\textbf{SheetAgent}$,这是一个利用LLM的新型自主代理。SheetAgent由三个协作模块$\textit{Planner}$、$\textit{Informer}$和$\textit{Retriever}$组成,通过迭代任务推理和反思,实现了对电子表格的高级推理和准确操作,无需人为干预。广泛的实验表明,SheetAgent在多个基准测试中相对于基线提高了20-30%的通过率,实现了电子表格操作的增强精度,并展示了卓越的表格推理能力。更多详细信息和可视化内容可访问https://sheetagent.github.io。
  • 作者讲解·2
  • 图表
  • 解决问题
    介绍了一种名为SheetRM的基准测试,用于评估长期和多类别任务的电子表格操作,以及解决多步推理和模糊要求等现实挑战。
  • 关键思路
    提出了一种名为SheetAgent的自主代理,它由三个协作模块组成,利用LLMs的能力实现高级推理和准确操作,通过迭代任务推理和反思实现电子表格的自动操作。
  • 其它亮点
    通过实验验证,SheetAgent在多个基准测试中相对于基线提高了20-30%的通过率,实现了电子表格操作的精度提升,并展示了卓越的表格推理能力。
  • 相关研究
    最近的相关研究包括:'Towards Learning to Reason over Tables','Table-to-Text: Describing Table Region with Natural Language'和'Multi-Task Learning for Table Semantic Parsing'。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问