Exploring the Mystery of Influential Data for Mathematical Reasoning

2024年04月01日
  • 简介
    选择对下游任务进行微调的有影响力的数据是性能和计算效率的关键因素。最近的研究表明,仅使用有限的数据进行训练可以在一般任务上展现出更优秀的性能。然而,在数学推理任务上的可行性尚未得到验证。为了进一步探讨这个问题,数学推理存在两个开放性问题:如何选择有影响力的数据和影响力数据的组成。针对前者,我们提出了一种适用于数学推理的质量感知多样选择(QaDS)策略。与其他选择策略的比较验证了QaDS的优越性。针对后者,我们首先扩大了我们的设置并探索了有影响力的数据组成。我们进行了一系列实验,并强调:扩大推理数据和使用QaDS选择的一般数据进行训练是有帮助的。然后,我们将我们的最佳混合定义为OpenMathMix,这是一种由QaDS选择的开源数据混合物。使用OpenMathMix,在7B基础模型上实现了48.8%的MATH准确率,达到了最先进水平。此外,我们展示了QaDS在创建具有各种选择比例的高效微调混合物方面的用途,并分析了各种开源数据集的质量,这可以作为未来数学推理任务的参考。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决数学推理任务中如何选择具有影响力的数据的问题,并验证了在数学推理任务中使用有限数据进行训练的可行性。同时,论文还探讨了如何组合具有影响力的数据以进一步提高性能。
  • 关键思路
    论文提出了一种适用于数学推理的质量感知多样选择(QaDS)策略,用于选择具有影响力的数据。通过与其他选择策略的比较,验证了QaDS的优越性。同时,论文通过实验探讨了具有影响力的数据组合的问题,并提出了一个由QaDS选择的开源数据组成的具有影响力的数据混合模型OpenMathMix,该模型在MATH数据集上取得了48.8%的准确率,达到了最新水平。
  • 其它亮点
    论文提供了一个适用于数学推理的QaDS策略,并通过实验验证了其优越性。论文提出了一个开源的具有影响力的数据混合模型OpenMathMix,并在MATH数据集上取得了最新水平的结果。此外,论文还探讨了如何创建具有不同选择比例的高效微调混合模型,并分析了一系列开源数据集的质量,为未来的数学推理研究提供了参考。
  • 相关研究
    最近的相关研究包括:《MathQA: Towards Interpretable Math Word Problem Solving with Operation-Based Formalisms》、《MathDQN: Solving Arithmetic Word Problems via Deep Reinforcement Learning》、《Neural Arithmetic Logic Units》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问