- 简介手术阶段识别是计算机辅助手术中的关键任务,旨在自动识别和分类手术过程中的不同阶段。尽管取得了实质性进展,但大多数现有方法依赖于完全监督的训练,需要昂贵且耗时的逐帧注释。时间戳监督最近出现作为一种有前途的替代方法,显著降低了注释成本,同时保持了竞争性能。然而,使用时间戳注释训练的模型可能会受到缺失阶段注释的负面影响,导致在实际情况下存在潜在的缺陷。在这项工作中,我们提出了一种强大的手术阶段识别方法,可以有效地处理缺失的阶段注释。此外,我们引入了SkipTag@K注释方法到手术领域,实现了注释工作量和模型性能之间的灵活平衡。我们的方法在两个具有挑战性的数据集上取得了竞争性的结果,证明了其处理缺失阶段注释的有效性以及降低注释成本的潜力。具体而言,我们在MultiBypass140数据集上仅使用每个视频3个已注释帧的情况下,实现了85.1%的准确度,展示了我们方法的有效性和SkipTag@K设置的潜力。我们进行了大量实验来验证我们方法的鲁棒性,并提供了有价值的见解,以指导未来在手术阶段识别方面的研究。我们的工作为手术工作流识别的进步做出了贡献,并为更高效和可靠的手术阶段识别系统铺平了道路。
-
- 图表
- 解决问题本文旨在解决计算机辅助手术中的手术阶段识别问题,并提出了一种能够有效处理缺失阶段注释的鲁棒方法。同时,引入了SkipTag@K注释方法,以在注释工作量和模型性能之间实现灵活平衡。
- 关键思路本文提出了一种使用时间戳监督学习的手术阶段识别方法,并通过引入跳过标注(SkipTag@K)方法来解决缺失注释的问题。
- 其它亮点本文的方法在两个具有挑战性的数据集上取得了有竞争力的结果,并且仅使用每个视频3帧注释即可在MultiBypass140数据集上达到85.1%的准确率。此外,本文的方法还具有较强的鲁棒性和有效性,为手术工作流程识别的发展做出了贡献。
- 在这个领域中,最近的相关研究包括:'Surgical Workflow Recognition using Recurrent Neural Networks with Optimized Step Size'、'EndoNet: A Deep Architecture for Recognition Tasks on Laparoscopic Videos'、'Temporal Convolutional Networks for Surgical Phase Recognition and Their Interpretability'等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流