
论文链接:http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?flag=2&file_no=202201170000006&journal_id=jig
视觉目标检测旨在定位和识别图像中存在的物体,属于计算机视觉领域的经典任务之一,也是许多计算机视觉任务的前提与基础,在自动驾驶、视频监控等领域具有重要的应用价值,受到研究人员的广泛关注。随着深度学习技术的飞速发展,目标检测取得了巨大的进展。首先,本文总结了深度目标检测在训练和测试过程中的基本流程。训练阶段包括数据预处理、检测网络、标签分配与损失函数计算等过程,测试阶段使用经过训练的检测器生成检测结果并对检测结果进行后处理。然后,回顾基于单目相机的视觉目标检测方法,主要包括基于锚点框的方法、无锚点框的方法和端到端预测的方法等。同时,总结了目标检测中一些常见的子模块设计方法。在基于单目相机的视觉目标检测方法之后,介绍了基于双目相机的视觉目标检测方法。在此基础上,分别对比了单目目标检测和双目目标检测的国内外研究进展情况,并展望了视觉目标检测技术发展趋势。通过总结和分析,希望能够为相关研究人员进行视觉目标检测相关研究提供参考。
视觉目标检测是计算机视觉的经典任务,旨在 定位图像中存在物体的位置并识别物体的具体类 别。目标检测是许多计算机视觉任务及相关应用的 基础与前提,直接决定相关视觉任务及应用的性能 好坏。因此,视觉目标检测技术受到了学术界、工业 界等各领域、乃至世界各国政府的广泛关注。在学 术界,目标检测一直是各大计算机视觉会议及期刊 的研究热点之一,每年有大量的目标检测相关论文 发表。根据谷歌学术显示,研究人员近 10 年来在目 标检测方面发表论文 15 000 余篇。在工业界,国内 外科技巨头(如谷歌、脸书、华为和百度等)、初创公 司(如商汤、旷视等)纷纷在目标检测相关领域投入 大量人力财力。与此同时,目标检测技术是新一代 人工智能的重要共性关键技术,世界各国竞相竞争。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢