受自然语言处理中变压器架构有效实现的启发,机器学习研究人员于2021年引入了视觉变压器(ViT)的概念,作为计算机视觉应用中卷积神经网络(CNNs)的替代方案。视觉变压器在公共基准测试中表现出色,可作为许多出版物的基础,包括图像分类和对象分割等应用,从而实现诸如在照片应用中搜索图片、使用RoomPlan测量房间尺寸或ARKIT语义功能等优秀用户体验。苹果神经引擎(ANE)上高效的变压器部署进一步推动了这一技术的发展。

本专栏通过快照技术转载,仅保留核心内容

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除