YOLObile: Real-Time Object Detection on Mobile Devices via Compression-Compilation Co-Design

论文链接:https://arxiv.org/abs/2009.05697

YOLObile:通过压缩编译协同设计在移动设备上进行实时目标检测,在三星S20上速度可达 17 FPS!比YOLOv4快5倍,同时mAP和FPS均优于YOLOv4-tiny! 作者单位:东北大学, 威廉与玛丽学院, 匹兹堡大学

目标检测技术的快速发展和广泛应用引起了对目标检测器的准确性和速度的关注。然而,当前的最新目标检测工作要么使用大型模型以准确性为导向,但导致高延迟,或者使用轻量级模型以速度为导向,但牺牲准确性。在这项工作中,我们提出了YOLObile框架,该框架是通过压缩编译协同设计在移动设备上进行实时目标检测的。针对任何内核大小,提出了一种新颖的block-punched剪枝方案。为了提高移动设备上的计算效率,采用了GPU-CPU协作方案以及高级的编译器辅助优化。实验结果表明,我们的剪枝方案以49.0 mAP达到YOLOv4压缩率的14倍。在我们的YOLObile框架下,我们在Samsung Galaxy S20上使用GPU实现了17 FPS推理速度。通过合并我们提出的GPU-CPU协作方案,推理速度提高到19.1 FPS,并且比原始YOLOv4高出5倍。

内容中包含的图片若涉及版权问题,请及时与我们联系删除