- 简介大型语言模型(LLMs)在自然语言处理(NLP)任务中展示出惊人的能力,引起了人们对其在具有更高专业要求的专业领域中应用的兴趣。然而,通过API获取封闭源代码LLMs的限制以及收集大规模高质量数据集的困难,阻碍了各种课程教育领域中大型语言模型的发展。鉴于这些挑战,我们提出了CourseGPT-zh,这是一个面向课程的教育LLM,支持定制和低成本部署。为了满足课程特定语料库的全面性和多样性要求,我们设计了一个高质量的问答语料库蒸馏框架,其中包括提示优化,有效地挖掘教科书知识并增强其多样性。此外,考虑到LLM响应与用户需求的一致性,引入了一种基于LLM-as-Judge的离散提示优化方法。在优化过程中,这个框架利用LLM反思和利用错误反馈和模式的能力,允许提示满足用户需求和偏好,同时节省响应长度。最后,我们利用参数高效微调获得了基于开源LLM的CourseGPT-zh。实验结果表明,我们的离散提示优化框架有效地提高了ChatGPT的响应质量,CourseGPT-zh在专业知识问答方面表现出强大的专业能力,显著优于可比的开源模型。
-
- 图表
- 解决问题本论文旨在解决教育领域中大规模语言模型的开发难题,提出了一种支持定制和低成本部署的面向课程的教育语言模型CourseGPT-zh,并设计了高质量的问答语料库提取框架,以及基于LLM-as-Judge的离散提示优化方法,以提高响应质量。
- 关键思路本论文的关键思路是通过高质量的问答语料库提取框架,以及基于LLM-as-Judge的离散提示优化方法,提高响应质量,从而实现面向课程的教育语言模型CourseGPT-zh。
- 其它亮点论文的亮点包括提出了面向课程的教育语言模型CourseGPT-zh,设计了高质量的问答语料库提取框架,以及基于LLM-as-Judge的离散提示优化方法,实验结果表明该方法有效提高了响应质量,CourseGPT-zh在专业领域的知识问答方面表现出色,明显优于可比较的开源模型。
- 近期在该领域的相关研究包括《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》、《XLNet: Generalized Autoregressive Pretraining for Language Understanding》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流