YOLO界再起波澜！mAP 51.4，149FPS，目标检测，一个就够了

百度飞桨团队发布了 PP-YOLOE，与其他 YOLO 系列算法相比，其具有更强的性能、更丰富灵活的配置方案以及更全硬件支持三大优势。

论文地址：https://arxiv.org/abs/2203.16250
项目地址：https://github.com/PaddlePaddle/PaddleDetection

相较于其他 YOLO 系列算法，PP-YOLOE 主要有以下三大优势：
更强性能：PP-YOLOE 的 s/m/l/x 全系列四个尺寸在精度及速度方面均超越其他同体量算法。详细数据如图 1 所示，其中 PP-YOLOE-l 在 COCO test-dev 上精度可达 51.4%，在 V100 上使用 TRT FP16 进行推理，速度可达 149FPS，相较于YOLOX-l^[4]精度提升 1.3 AP，速度提升 24.96%；相较于YOLOv5-x^[5]精度提升 0.7AP，TRT-FP16 加速 26.8%；相较于PP-YOLOv2^[6]精度提升 1.9 AP，速度提升 13.35%。

图 1 PP-YOLOE 各尺寸模型性能与其他模型对比示意图

更丰富灵活的配置方案：PP-YOLOE 不仅提供 4 种固定尺寸，且支持开发者灵活地定制化配置更多尺寸；顺畅支持包括模型量化、剪枝和蒸馏在内丰富的模型优化策略，满足实际产业场景中速度和精度的极致追求；全面高质量支持包括 TensorRT 和 OpenVINO 在内的加速库，还提供一键转出 ONNX 格式，可顺畅对接 ONNX 生态。

更全硬件支持：PP-YOLOE 在结构设计上避免使用 DCN、Matrix NMS 等不易部署的算子，使其可以方便地部署到不同的硬件当中。当前已经完备支持 NVIDIA V100、T4 这样的云端 GPU 架构以及如 Jetson 系列等边缘端 GPU 设备。

PP-YOLOE 相较前几代 YOLO 算法的性能提升主要源于以下三点改进：
1. 新颖、统一的 Backbone 和 Neck 设计，更方便灵活配置多种尺寸。2. 引入了更高效的标签分配策略 TAL(Task Alignment Learning)的动态匹配策略，解决了目标检测任务中常见的分类回归不均衡难题，提高检测精度。3. 设计了更简洁的 ET-Head(Efficient Task-aligned Head)，以少量的速度损失为代价提升了精度。

图 2 PP-YOLOE 模型结构示意图

内容中包含的图片若涉及版权问题，请及时与我们联系删除

YOLO界再起波澜！mAP 51.4，149FPS，目标检测，一个就够了

评论