- 简介Table understanding(TU)已经取得了很大的进展,但是它面临着手动标记表格的稀缺性和复杂表格结构的存在等挑战。为了解决这些挑战,我们提出了HGT框架,它是一个带有异构图(HG)增强的大型语言模型(LLM),用于解决少样本TU任务。它通过软提示和指令转换将表格语义与LLM的参数知识对齐,并通过涉及三个新的多粒度自监督HG预训练目标的多任务预训练方案来处理复杂表格。我们通过实验证明了HGT的有效性,并展示了它在几个基准测试中优于少样本复杂TU的SOTA。
- 图表
- 解决问题本篇论文旨在解决表格理解中手动标注表格稀缺以及复杂表格结构的挑战。同时,作者试图通过提出一种新的框架来验证其在少样本表格理解任务上的有效性。
- 关键思路HGT框架通过引入异构图增强的大型语言模型来解决少样本表格理解任务。该框架通过软提示和指令转换将表格语义与语言模型的参数化知识对齐,并通过三个新的多粒度自监督异构图预训练目标的多任务预训练方案来处理复杂表格。
- 其它亮点论文在多个基准测试中验证了HGT的有效性,并展示了其在少样本复杂表格理解上优于现有技术水平。实验设计详细,使用了多个数据集,并提供了开源代码。该工作的亮点在于提出了一种新的框架,通过多粒度自监督预训练来处理复杂表格,具有很高的实用价值。
- 最近在表格理解领域中,还有一些相关研究,例如《TabFormer: 一个端到端的Transformer模型用于表格理解》和《表格理解中的Few-shot学习:方法和评估》。
沙发等你来抢
去评论
评论
沙发等你来抢