论文标题:Searching the Deployable Convolution Neural Networks for GPUs
本文旨在利用神经结构搜索(NAS)来优化模型的推理延迟。为了实现这一目标,建立了一个分布式NAS系统来在一个新的搜索空间上进行搜索,将NAS优化模型命名为GPUNet
,它在推断延迟和准确性方面建立了一个新的SOTA Pareto前沿。
在1ms内,GPUNet
比EfficientNet-X
和FBNetV3
快2倍,而且精度更高。GPUNet
在COCO检测任务上在延迟和准确性上始终优于EfficientNet-X
和FBNetV3
。所有这些数据都验证了NAS系统在处理不同的设计任务方面是有效且通用的。通过这个NAS系统,作者扩展了GPUNet
,以覆盖广泛的延迟目标,这样DL从业者就可以在不同的场景中直接部署模型。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢