- 简介预训练模型(PTMs)的出现彻底改革了软件工程(SE)活动,PTMs是指可以微调以执行特定SE任务的大型机器学习(ML)模型。然而,对于专业知识有限的用户来说,他们可能需要帮助选择适合当前任务的模型。为了解决这个问题,Hugging Face(HF)平台通过收集、存储和策划多个模型来简化使用PTMs。然而,该平台目前缺乏专门为SE设计的PTMs的全面分类,即现有标签更适用于通用的ML类别。本文介绍了一种方法来解决这个问题,即通过启用自动分类PTMs来执行SE任务。首先,我们利用HF的公共转储提取PTMs信息,包括模型文档和相关标签。然后,我们采用半自动化方法从现有文献中识别SE任务及其相应的PTMs。该方法涉及使用基于相似性的策略创建HF标签和特定SE任务之间的初始映射,以识别具有相关标签的PTMs。评估结果表明,模型卡足以根据管道标签对PTMs进行分类。此外,我们通过依赖模型名称提供了SE任务和存储的PTMs之间的映射。
-
- 图表
- 解决问题本文试图解决如何自动分类预训练模型(PTMs)用于软件工程任务的问题,以及缺乏专门针对软件工程的PTMs分类的问题。
- 关键思路本文的关键思路是通过使用相似性策略建立HF标签和软件工程任务之间的初始映射,从而自动分类PTMs。
- 其它亮点本文使用公共HF的信息提取PTMs信息,使用半自动化方法从现有文献中识别软件工程任务及其对应的PTMs。通过评估发现,模型卡足以根据管道标签对PTMs进行分类。此外,本文提供了一个基于模型名称的软件工程任务和存储的PTMs之间的映射。
- 最近的相关研究包括使用PTMs进行软件工程任务的研究,以及自动化选择模型的研究。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流