YOLO9tr: A Lightweight Model for Pavement Damage Detection Utilizing a Generalized Efficient Layer Aggregation Network and Attention Mechanism

2024年06月17日
  • 简介
    保持道路路面完整性对于确保安全和高效的交通至关重要。传统的评估路面状况的方法通常很费力且容易受到人为误差的影响。本文提出了一种新颖的轻量级物体检测模型YOLO9tr,用于路面损伤检测,利用深度学习的进展。YOLO9tr基于YOLOv9架构,结合了部分注意力块,增强了特征提取和注意机制,提高了在复杂场景下的检测性能。该模型在包括多个国家的道路损伤图像的全面数据集上进行训练,包括超出标准四种的扩展损伤类别。这种扩大的分类范围可以更准确、更真实地评估路面状况。比较分析表明,与YOLO8、YOLO9和YOLO10等最先进的模型相比,YOLO9tr具有更高的精度和推理速度,实现了计算效率和检测精度之间的平衡。该模型实现了高达136 FPS的高帧率,适用于视频监控和自动化检测系统等实时应用。该研究还进行了消融研究,分析了架构修改和超参数变化对模型性能的影响,进一步验证了部分注意力块的有效性。结果突出了YOLO9tr在实时路面状况监测中的潜力,为维护安全和功能性道路基础设施的稳健和高效的解决方案的发展做出了贡献。
  • 图表
  • 解决问题
    论文旨在提出一种基于深度学习的轻量级物体检测模型,用于道路损伤检测,以解决传统方法中存在的人工错误和耗时问题。
  • 关键思路
    该论文提出了YOLO9tr模型,它基于YOLOv9架构,加入了部分注意力块,以增强特征提取和注意机制,从而在复杂场景下提高检测性能。该模型在多个国家的道路损伤图像上进行训练,包括超出标准四种损伤类别的扩展分类范围,实现更准确和真实的评估路面状况。
  • 其它亮点
    该论文提出的YOLO9tr模型具有高精度和推理速度的平衡,可达到高达136 FPS的高帧率,适用于实时应用,如视频监控和自动化检测系统。论文还进行了消融研究,分析了架构修改和超参数变化对模型性能的影响,进一步验证了部分注意力块的有效性。
  • 相关研究
    最近的相关研究包括基于深度学习的物体检测和分类模型,如Faster R-CNN、SSD和YOLO系列等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论