- 简介现代的代码审查是一种关键的质量保证过程,被广泛应用于工业和开源软件环境中。这个过程可以帮助新手从有经验的审查人员的反馈中学习,但是它通常会给审查人员带来大量的工作负担和压力。为了减轻这种负担,自动化代码审查领域旨在自动化这个过程,教会大型语言模型像人类一样提供对提交的代码的审查。最近的一种方法是在大规模代码审查语料库上预训练并微调代码智能语言模型。然而,这样的技术没有充分利用训练数据中的高质量审查。事实上,有更高经验水平或对代码更熟悉的审查人员很可能会提供比其他人更深入的见解。在这项研究中,我们着手调查是否可以通过基于经验感知过采样技术训练的自动化代码审查模型生成更高质量的审查。通过我们的定量和定性评估,我们发现经验感知过采样可以增加当前最先进的模型生成的审查的正确性、信息水平和意义,而不需要引入新的数据。结果表明,目前的训练策略没有充分利用大量高质量的审查。这项工作为提高自动化代码审查模型的资源效率提供了启示。
- 图表
- 解决问题本论文旨在探讨如何通过经验感知的过采样技术,提高自动化代码审查模型的质量,以减轻人工审查员的工作负担。
- 关键思路通过经验感知的过采样技术,可以更好地利用高质量的审查数据来训练自动化代码审查模型,从而提高其准确性、信息量和意义。
- 其它亮点论文使用了大规模的代码审查语料库进行预训练,并通过经验感知的过采样技术进行微调,实现了更好的自动化代码审查效果。实验结果表明,该方法可以提高自动化代码审查模型的质量,同时节约了人力成本。
- 近年来,自动化代码审查领域的相关研究不断涌现。例如,基于深度学习的代码审查模型、基于规则的代码审查模型等。
沙发等你来抢
去评论
评论
沙发等你来抢