TelecomGPT: A Framework to Build Telecom-Specfic Large Language Models

2024年07月12日
  • 简介
    大型语言模型(LLMs)有潜力改变第六代(6G)通信网络。然而,目前主流的LLMs普遍缺乏电信领域的专业知识。在本文中,我们首次提出了一种将任何通用LLMs适应为电信特定LLMs的流程。我们收集和构建了电信特定的预训练数据集、指令数据集和偏好数据集,以执行连续的预训练、指令调整和对齐调整。此外,由于电信领域缺乏广泛接受的评估基准,我们扩展了现有的评估基准,并提出了三个新的基准,即电信数学建模、电信开放式问答和电信代码任务。这些新的基准提供了对LLMs在电信领域的数学建模、开放式问题回答、代码生成、填充、摘要和分析等能力的全面评估。我们的精细调整的LLM TelecomGPT在电信数学建模基准中明显优于GPT-4、Llama-3和Mistral等SOTA LLMs,并在各种评估基准中取得了可比较的表现,如TeleQnA、3GPP技术文件分类、电信代码摘要和生成以及填充。
  • 图表
  • 解决问题
    将通用型大型语言模型(LLMs)转化为电信特定的LLMs,以解决当前主流LLMs在电信领域缺乏专业知识的问题。同时,扩展电信领域的评估基准,以全面评估LLMs在电信领域的能力。
  • 关键思路
    通过收集和构建电信特定的预训练数据集、指令数据集和偏好数据集,分别进行连续预训练、指令调整和对齐调整,以将通用型LLMs转化为电信特定的LLMs。
  • 其它亮点
    提出了三个新的电信领域评估基准,包括电信数学建模、电信开放式问答和电信代码任务。通过实验表明,所提出的LLM TelecomGPT在电信数学建模基准中显著优于当前SOTA LLMs,同时在其他评估基准中也表现出色。
  • 相关研究
    当前没有列举相关研究的信息。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论