Predicting Learning Performance with Large Language Models: A Study in Adult Literacy

2024年03月04日
  • 简介
    智能辅导系统(ITS)极大地增强了成人识字培训,这是社会参与、就业机会和终身学习的关键因素。我们的研究调查了应用先进的人工智能模型,包括大型语言模型(LLMs)如GPT-4,来预测ITS中成人识字计划的学习表现。这项研究的动机在于LLMs预测学习表现的潜力,基于其固有的推理和计算能力。通过使用ITS的阅读理解数据集AutoTutor,我们通过五折交叉验证技术评估了GPT-4与传统机器学习方法在预测学习表现方面的预测能力。我们的研究结果显示,GPT-4具有与传统机器学习方法(如贝叶斯知识追踪、性能因素分析、稀疏因素分析Lite(SPARFA-Lite)、张量分解和极限梯度提升(XGBoost))相媲美的预测能力。虽然XGBoost(在本地机器上训练)在预测准确性方面优于GPT-4,但GPT-4选择的XGBoost及其在GPT-4平台上的后续调整表现优于在本地机器上执行。此外,我们对GPT-4与网格搜索进行的超参数调整的调查表明,在使用XGBoost作为案例研究时,自动化方法的性能虽然不太稳定,但与网格搜索相当。我们的研究通过突出LLMs与传统机器学习模型相结合的潜力,以增强预测准确性和个性化成人识字教育,为将来在ITS中应用LLMs打下基础。
  • 图表
  • 解决问题
    本文旨在研究应用大型语言模型(LLMs)如GPT-4等高级AI模型,预测成人识字计划中的学习表现,以提高个性化教育。
  • 关键思路
    本文提出了将LLMs与传统机器学习模型相结合,以提高预测精度的方法,并验证了GPT-4在预测学习表现方面的竞争力。
  • 其它亮点
    本文使用五倍交叉验证技术,比较了GPT-4与传统机器学习方法在预测学习表现方面的能力。实验结果表明,GPT-4具有与传统机器学习方法相当的预测能力,并且可以与传统机器学习方法相结合以提高预测精度。此外,本文还研究了GPT-4与传统网格搜索方法在超参数调整方面的比较,结果表明两种方法具有相当的性能。
  • 相关研究
    最近的相关研究包括“基于深度学习的智能教育系统”(Intelligent Education System Based on Deep Learning)和“使用深度学习进行自适应学习的研究”(Research on Adaptive Learning Using Deep Learning)。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论