论文标题:FastHand: Fast Hand Pose Estimation From A Monocular Camera 论文链接:https://arxiv.org/abs/2102.07067 作者单位:北航 & 京东

编码器由带有少量参数的深层组成,而解码器则利用空间位置信息来获得更准确的结果,在Jetson TX2上速度可达25 FPS! 手势识别是大多数与人机交互相关的方法的第一步。此任务有两个主要挑战。第一个对应于在现实情况下难以获得稳定且准确的手部关键点预测的难度,第二个对应于减少前向推理的时间。在本文中,我们提出了一种快速准确的手势估计框架,称为“ FastHand”。通过使用轻量级的编解码器网络体系结构,我们可以满足在嵌入式设备上运行的实际应用的要求。编码器由带有少量参数的深层组成,而解码器则利用空间位置信息来获得更准确的结果。评估是在两个可公开获得的数据集上进行的,这些数据集证明了与其他最新方法相比,提出中pipeple的性能有所提高。在NVIDIA Jetson TX2上,FastHand提供了很高的准确性得分,同时达到了每秒25帧的速度。

内容中包含的图片若涉及版权问题,请及时与我们联系删除