ELF-UA: Efficient Label-Free User Adaptation in Gaze Estimation

2024年06月13日
  • 简介
    本文探讨了用户自适应的3D凝视估计问题。由于不同人的解剖结构差异,个人无关的凝视估计性能受到限制。我们的目标是提供一个针对特定用户的个性化凝视估计模型。以往的用户自适应凝视估计研究需要一些目标人员数据的标记图像来在测试时微调模型。然而,在现实应用中,这可能不现实,因为终端用户提供标记图像是繁琐的。此外,以往的研究需要训练数据同时具有凝视标签和人员ID。这个数据要求使得使用一些可用数据变得不可行。为了解决这些挑战,本文提出了一个称为高效无标签用户自适应凝视估计的新问题。我们的模型只需要一些目标用户的未标记图像来进行模型适应。在离线训练期间,我们有一些没有人员ID的标记源数据和一些未标记的人员特定数据。我们提出的方法使用元学习方法来学习如何在只有少量未标记图像的情况下适应新用户。我们的关键技术创新是使用域适应的泛化界限来定义元学习中的损失函数,使得我们的方法可以在训练期间有效利用标记源数据和未标记的人员特定数据。广泛的实验验证了我们的方法在几个具有挑战性的基准测试上的有效性。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决用户自适应3D凝视估计的问题。由于人际解剖差异,个体无关的凝视估计性能有限。论文的目标是提供一个特定于目标用户的个性化凝视估计模型。但是,以前的工作需要一些标记的目标人数据图像,以在测试时微调模型。这在实际应用中可能不切实际,因为终端用户提供标记图像是繁琐的。此外,以前的工作要求训练数据具有注视标签和人员ID。这种数据要求使得使用某些可用数据变得不可行。为了解决这些挑战,论文提出了一个称为高效无标签用户自适应凝视估计的新问题。论文的模型只需要一些目标用户的未标记图像进行模型自适应。在离线训练期间,我们有一些没有人员ID的标记源数据和一些未标记的人员特定数据。我们提出的方法使用元学习方法来学习如何适应只有少量未标记图像的新用户。我们的关键技术创新是使用领域适应的泛化界限来定义元学习中的损失函数,以便我们的方法可以在训练期间有效利用标记的源数据和未标记的人员特定数据。论文的目标是解决用户自适应3D凝视估计的问题,并提出了一种新的元学习方法。
  • 关键思路
    论文提出了一种新的元学习方法,使用领域适应的泛化界限来定义元学习中的损失函数。该方法可以在训练期间有效利用标记的源数据和未标记的人员特定数据,从而实现高效无标签用户自适应凝视估计。
  • 其它亮点
    论文的方法使用元学习来实现高效无标签用户自适应凝视估计。使用领域适应的泛化界限来定义元学习中的损失函数,以便利用标记的源数据和未标记的人员特定数据。论文在多个具有挑战性的基准测试上验证了该方法的有效性。论文的方法为解决用户自适应3D凝视估计提供了一种新的思路。
  • 相关研究
    最近的相关研究包括:1.《Gaze Embeddings for Zero-Shot Image-Based Gaze Estimation》;2.《Appearance-Based Gaze Estimation in the Wild》;3.《Learning-by-Synthesis for Appearance-based 3D Gaze Estimation》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问