Mathematical Language Models: A Survey

Wentao Liu ,
Hanglei Hu ,
Jie Zhou ,
Yuyang Ding ,
Junsong Li ,
Jiayi Zeng ,
Mengliang He ,
Qin Chen ,
Bo Jiang ,
Aimin Zhou ,
Liang He
2023年12月12日
  • 简介
    近年来,在数学领域中,利用语言模型(LMs),包括预训练语言模型(PLMs)和大规模语言模型(LLMs),取得了显著进展。本文对数学LMs进行了全面调查,从任务和方法论两个不同的角度系统地分类了关键的研究努力。这个领域展示了大量提出的数学LLMs,进一步划分为指令学习、基于工具的方法、基础CoT技术和先进的CoT方法。此外,我们的调查包括编制了60多个数学数据集,包括训练数据集、基准数据集和增强数据集。本文旨在解决主要挑战并勾勒出数学LM领域未来的发展方向,被定位为一个宝贵的资源,旨在促进和激发未来致力于推动该领域发展的研究人员的创新。
  • 图表
  • 解决问题
    本论文旨在综合评估数学领域中的语言模型(Language Models, LMs)在解决数学问题中的应用,包括预训练语言模型(Pre-trained Language Models, PLMs)和大规模语言模型(Large-scale Language Models, LLMs),并提供超过60个数学数据集的综合概述。
  • 关键思路
    本文系统分类了数学LMs的关键任务和方法,包括基于指令学习、基于工具的方法、基础CoT技术和高级CoT方法,探讨了数学LMs面临的主要挑战,并提出了未来的研究方向。
  • 其它亮点
    本文提供了超过60个数学数据集的综合概述,包括训练数据集、基准数据集和增强数据集。此外,本文还介绍了当前数学LMs领域中的研究亮点,如实验设计、使用的数据集以及开源代码等。本文为数学LMs领域的研究者提供了宝贵的资源和灵感。
  • 相关研究
    近年来,数学LMs领域的研究呈现出快速增长的趋势。相关的研究包括《MathBERT: A Pre-trained Language Model for Mathematical Text》、《MathQA: Towards Interpretable Math Word Problem Solving with Operation-Based Formalisms》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论