CourseGPT-zh: an Educational Large Language Model Based on Knowledge Distillation Incorporating Prompt Optimization

向作者提问

NEW

简介

大型语言模型(LLMs)在自然语言处理(NLP)任务中展示出惊人的能力，引起了人们对其在具有更高专业要求的专业领域中应用的兴趣。然而，通过API获取封闭源代码LLMs的限制以及收集大规模高质量数据集的困难，阻碍了各种课程教育领域中大型语言模型的发展。鉴于这些挑战，我们提出了CourseGPT-zh，这是一个面向课程的教育LLM，支持定制和低成本部署。为了满足课程特定语料库的全面性和多样性要求，我们设计了一个高质量的问答语料库蒸馏框架，其中包括提示优化，有效地挖掘教科书知识并增强其多样性。此外，考虑到LLM响应与用户需求的一致性，引入了一种基于LLM-as-Judge的离散提示优化方法。在优化过程中，这个框架利用LLM反思和利用错误反馈和模式的能力，允许提示满足用户需求和偏好，同时节省响应长度。最后，我们利用参数高效微调获得了基于开源LLM的CourseGPT-zh。实验结果表明，我们的离散提示优化框架有效地提高了ChatGPT的响应质量，CourseGPT-zh在专业知识问答方面表现出强大的专业能力，显著优于可比的开源模型。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在解决教育领域中大规模语言模型的开发难题，提出了一种支持定制和低成本部署的面向课程的教育语言模型CourseGPT-zh，并设计了高质量的问答语料库提取框架，以及基于LLM-as-Judge的离散提示优化方法，以提高响应质量。
关键思路

本论文的关键思路是通过高质量的问答语料库提取框架，以及基于LLM-as-Judge的离散提示优化方法，提高响应质量，从而实现面向课程的教育语言模型CourseGPT-zh。
其它亮点

论文的亮点包括提出了面向课程的教育语言模型CourseGPT-zh，设计了高质量的问答语料库提取框架，以及基于LLM-as-Judge的离散提示优化方法，实验结果表明该方法有效提高了响应质量，CourseGPT-zh在专业领域的知识问答方面表现出色，明显优于可比较的开源模型。
相关研究

近期在该领域的相关研究包括《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》、《XLNet: Generalized Autoregressive Pretraining for Language Understanding》等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问