Evaluating Time-Dependent Methods and Seasonal Effects in Code Technical Debt Prediction

2024年08月15日
  • 简介
    “代码技术债务预测”已成为近期软件工程文献中备受关注的研究领域。技术债务是软件项目中的一个重要度量标准,因为它衡量了专业人员清理代码所需的工作量。因此,预测它的未来行为变得至关重要。然而,目前没有一个明确定义和一致的方法能够完全捕捉到影响“代码技术债务”演变的特征。本研究的目的是在“代码技术债务”的背景下,评估考虑时间依赖技术以及季节效应对时间数据预测性能的影响。本研究采用了现有但尚未广泛采用的时间依赖预测技术,并将其预测性能与常用的机器学习模型进行比较。此外,本研究通过扩展分析以捕捉“代码技术债务”数据的季节性影响,进一步加强了对时间依赖方法的评估。我们使用Java开发的31个开源项目的提交历史来训练了11个预测模型。我们预测了SQALE指数的未来观测结果,以评估它们的预测性能。本研究证实了考虑时间依赖技术的积极影响。采用的多元时间序列分析模型ARIMAX超越了其它采用的模型。纳入季节效应提高了采用时间依赖技术的预测性能。然而,这种影响的程度相对较小。本研究的发现证实了我们支持实施能够捕捉软件度量历史数据中现有时间依赖性的技术的立场,特别是在本研究的背景下,即“代码技术债务”。这需要利用能够有效解决这一证据的技术。
  • 图表
  • 解决问题
    本论文试图解决在软件工程领域中的技术债务问题,即如何预测代码技术债务的未来行为。
  • 关键思路
    本论文采用了时间依赖技术和季节性影响等方法来预测代码技术债务的未来行为,同时比较了常用机器学习模型的预测性能。论文的关键思路是采用ARIMAX等多元时间序列分析模型来处理历史数据中的时间依赖性,从而提高预测性能。
  • 其它亮点
    本论文使用Java开源项目的提交历史记录训练了11个预测模型,并使用SQALE指数来评估它们的预测性能。实验结果表明,采用时间依赖技术可以提高预测性能,而ARIMAX模型的预测性能最好。同时,考虑到季节性影响可以进一步提高预测性能,但影响相对较小。本论文的亮点在于采用了时间依赖技术和季节性影响等方法来处理历史数据,从而提高了预测性能。
  • 相关研究
    在最近的研究中,也有一些关于代码技术债务预测的研究,例如“Predicting Technical Debt: A Case Study on the Qt Framework”和“An empirical investigation of machine learning approaches for technical debt prediction”等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论