A Picture is Worth 500 Labels: A Case Study of Demographic Disparities in Local Machine Learning Models for Instagram and TikTok

2024年03月27日
  • 简介
    移动应用程序通过将数据处理转移到用户的智能手机上,已经实现了对用户隐私的保护。现在,先进的机器学习(ML)模型,如视觉模型,可以在本地分析用户图像以提取推动多种功能的洞见。利用这种新的处理模型,即本地分析用户图像,我们分析了两个流行的社交媒体应用程序TikTok和Instagram,以揭示(1)这两个应用程序中的视觉模型从用户的图像和视频数据中推断出的关于用户的洞见,以及(2)这些模型是否在不同人口群体中表现出性能差异。由于视觉模型为年龄验证和面部识别等敏感技术提供信号,因此了解这些模型中潜在的偏见对于确保用户获得公平和准确的服务至关重要。我们开发了一种新颖的方法来捕捉和评估移动应用程序中的ML任务,克服了代码混淆、本地代码执行和可扩展性等挑战。我们的方法包括ML任务检测、ML管道重构和ML性能评估,特别关注人口统计差异。我们将我们的方法应用于TikTok和Instagram,揭示了重要的洞见。对于TikTok,我们发现年龄和性别预测准确性存在问题,特别是对于未成年人和黑人。在Instagram中,我们的分析揭示了在从图像中提取500多个视觉概念时存在人口统计差异,证明了人口统计特征和某些概念之间的虚假相关性。
  • 图表
  • 解决问题
    本论文旨在分析两个流行社交媒体应用程序TikTok和Instagram中的视觉模型对用户图像和视频数据的推断,以及这些模型是否存在与人口统计学相关的表现差异。
  • 关键思路
    该论文提出了一种新的方法来捕捉和评估移动应用程序中的机器学习任务,包括ML任务检测、ML管道重构和ML性能评估,特别是关注人口统计学差异。通过该方法,作者揭示了TikTok和Instagram中的一些问题和差异。
  • 其它亮点
    该论文的亮点包括开发了一种新的方法来评估移动应用程序中的机器学习任务,揭示了TikTok和Instagram中的视觉模型的潜在偏见,以及在图像中提取的500多个视觉概念之间存在的虚假相关性。该论文使用了大量的数据集和实验设计,这些实验结果值得深入研究。
  • 相关研究
    在相关研究方面,最近的研究包括《如何评估人工智能技术的公平性:从算法公平性到社会公正性》和《从算法公平性到社会公正性:人工智能技术的公平性评估》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论