- 简介在外科手术技能评估中,技术客观结构化评估(OSATS)分数和整体评分量表(GRS)是评估外科医生培训期间表现的工具。这些指标结合对其表现的反馈,使外科医生能够改进并达到实践标准。最近针对开源数据集JIGSAW进行的研究,该数据集包含GRS和OSATS标签,重点关注从运动学信号、视频数据或两者的组合中回归GRS分数。在本文中,我们认为仅通过回归无单位的GRS分数本身过于局限,手术试验中的变化并没有重要的临床意义。为了解决这个问题,我们开发了一个循环变压器模型,通过将模型的隐藏状态与从运动学信号导出的五个OSATS分数相关联,输出外科医生在培训过程中的表现。这些分数取平均并聚合以产生GRS预测,使得可以评估模型的表现与最先进技术的表现。我们报告了Spearman相关系数(SCC),表明我们的模型在所有任务中都优于SOTA模型,除了在留一主题外的缝合任务下(SCC 0.68-0.89),在留一用户外的缝合任务下(SCC 0.45-0.68)和各项任务中取得可比较的表现,并在针穿任务中超越了SOTA(0.69)。我们认为将最终的OSATS分数与外科医生手术过程中的短实例相关联更具临床意义,而不是单个GRS分数。这种方法还使我们能够将定量预测转化为定性反馈,这对于任何自动化的外科手术技能评估流程至关重要。一位高级外科医生验证了我们模型的行为,并在77%(p = 0.006)的时间内同意半监督预测。
-
- 图表
- 解决问题本论文旨在解决外科手术技能评估中单一的全局评分标准(GRS)无法准确反映整个手术过程的问题,并提出了一种基于循环变压器模型的解决方案。
- 关键思路该论文的关键思路是将五个基于运动学信号的OSATS分数与模型的隐藏状态相关联,以输出外科医生在整个培训过程中的表现,并将这些分数平均聚合以产生GRS预测。
- 其它亮点该论文使用JIGSAW数据集进行实验,并报告了Spearman相关系数(SCC),证明该模型在除了LOSO下的缝合任务(SCC 0.68-0.89)外,所有任务均优于SOTA模型,在LOUO下的缝合和跨任务的所有任务中实现了可比较的表现(SCC 0.45-0.68),并在针穿任务中超过了SOTA(0.69)。研究人员还通过将定量预测转化为定性反馈来解释了模型的预测结果。研究人员还进行了高级外科医生的验证。
- 最近的相关研究包括使用运动学信号,视频数据或两者的组合来回归GRS分数,以及使用深度学习模型进行手术技能评估。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流