图片

论文链接:https://arxiv.org/abs/2212.10079

随着现代软件的复杂性不断升级,软件工程已经成为一项越来越令人生畏且容易出错的工作。近年来,神经代码智能(NCI)领域已经成为一种有前途的解决方案,利用深度学习技术的力量来解决源代码的分析任务,目标是提高编程效率,并最大限度地减少软件行业中的人为错误。预训练语言模型已经成为NCI研究的主导力量,在广泛的任务中始终如一地提供最先进的结果,包括代码摘要、生成和翻译。在本文中,我们对NCI领域进行了全面的调研,包括对预训练技术、任务、数据集和模型架构的全面回顾。我们希望这篇论文能成为自然语言和编程语言社区之间的桥梁,为这一快速发展领域的未来研究提供见解。

内容中包含的图片若涉及版权问题,请及时与我们联系删除