论文标题:Multi-Task Network Pruning and Embedded Optimization for Real-time Deployment in ADAS 论文链接:https://arxiv.org/abs/2101.07831 作者单位:法雷奥(Valeo) 基于摄像头的深度学习算法越来越被自动驾驶系统中的感知所需要。但是,来自汽车行业的限制条件是通过使用有限的计算资源设置嵌入式系统来挑战CNN的部署。在本文中,我们提出了一种在这种条件下将多任务CNN网络嵌入商业原型平台的方法。一种低功耗片上系统(SoC),以10 FPS的速度处理四个环视鱼眼摄像头。
第一个重点是设计一种高效且紧凑的多任务网络体系结构。其次,采用剪枝方法压缩CNN,从而在不显著降低性能的情况下,将运行时和内存使用量减少了2倍。最后,提出了几种嵌入式优化技术,例如混合量化格式用法和不同存储区域之间的有效数据传输,以确保实时执行并避免带宽瓶颈。考虑到嵌入式检测性能,运行时和内存带宽,在硬件平台上对该方法进行了评估。与文献中大多数关注分类任务的工作不同,我们的目的是研究剪枝和量化对具有目标检测,语义分割和污染检测任务的紧凑型多任务网络的影响。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢