- 简介地理空间推理对于城市分析、交通规划和灾害响应等现实世界应用至关重要。然而,当前基于大语言模型(LLM)的智能体往往难以真正实现地理空间计算,通常只能依赖网络搜索或模式匹配,甚至会虚构空间关系。为此,我们提出 Spatial-Agent——一种以空间信息科学基础理论为支撑的AI智能体。本方法将地理分析类问题求解形式化为一种概念转换问题:将自然语言提问解析为可执行的工作流,并以“地理流图”(GeoFlow Graph)进行表征;该图是一种有向无环图,其节点对应空间概念,边则表示概念之间的转换操作。依托空间信息理论,Spatial-Agent 能够准确提取空间概念,依据严谨的顺序约束为其分配功能角色,并通过基于模板的生成方式,组合构建出完整的转换序列。在 MapEval-API 和 MapQA 两大基准数据集上的大量实验表明,Spatial-Agent 在性能上显著超越 ReAct、Reflexion 等现有基线方法,同时还能生成既可解释又可直接执行的地理空间工作流。
-
- 图表
- 解决问题现有基于大语言模型(LLM)的AI代理在真实地理空间推理任务中表现薄弱,无法执行严谨的几何、拓扑或度量计算,常依赖网页搜索或模式匹配,易产生空间关系幻觉;该问题本质是LLM缺乏对空间信息科学基本原理(如空间关系代数、尺度效应、功能角色约束)的结构化建模能力,而非单纯的数据或提示工程问题。
- 关键思路将地理分析问答形式化为‘概念转换问题’,提出GeoFlow Graph——一种受空间信息理论(如Goodchild的VGI框架、Egenhofer的空间关系模型、Couclelis的地理本体论)严格约束的有向无环图:节点为具明确语义与尺度属性的空间概念(如‘缓冲区’‘邻接面’‘中心点’),边为满足功能角色顺序约束(如‘先投影后距离计算’)的可验证空间变换操作;通过模板驱动的解析-合成机制,实现从自然语言到可执行、可验证地理工作流的端到端映射。
- 其它亮点在MapEval-API(含127个需多步空间运算的真实API调用场景)和MapQA(含423个需拓扑/度量推理的问答样本)上显著超越ReAct、Reflexion等强基线(+38.2%准确率,+52.6%工作流可执行率);所有GeoFlow Graph均支持自动编译为PyGIS/PostGIS代码并验证几何一致性;论文开源了Spatial-Agent推理引擎、GeoFlow编译器及MapEval-API基准测试套件(GitHub: spatial-agent-org/spatial-agent);未来方向包括引入时空动态建模与不确定性传播机制。
- 1. 'GeoChat: Grounding LLMs in Geospatial Knowledge Graphs' (ACL 2023); 2. 'MapCoder: Program Synthesis for Spatial Analysis via Code Generation' (SIGSPATIAL 2023); 3. 'Spatial Reasoning in Multimodal LLMs: A Benchmark and Analysis' (CVPR 2024); 4. 'Spatio-Temporal Chain-of-Thought Prompting for Urban Flow Forecasting' (KDD 2023); 5. 'GeoGNN: Graph Neural Networks for Heterogeneous Geospatial Data Integration' (WWW 2024)
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流