标题:FAIR|脸书开源衡量人工智能的公平性:休闲对话数据集
简介:本文介绍了一个新的数据集,以帮助研究人员评估他们的计算机视觉和音频模型的准确性,跨越不同的年龄,性别,明显的肤色和环境照明条件。我们的数据集由3,011个主题组成,包含超过45,000个视频,平均每人15个视频。这些视频在美国多个州录制,有不同年龄、性别和明显肤色组的不同成年人。一个关键特征是,每个主题都同意参与使用其类似物。此外,我们的年龄和性别注释由受试者自己提供。一组训练有素的注释器使用菲茨帕特里克皮肤类型比例标记了受试者的明显肤色。此外,还提供了在低环境照明下录制的视频的注释。作为衡量某些属性预测的稳健性的应用,我们提供了对前五名获奖者的全面研究。实验评价表明,获胜模型在某些特定人群(如肤色较深的受试者)中表现较差,因此可能不会向所有人推广。此外,我们还评估最先进的明显年龄和性别分类方法。我们的实验提供了对这些模型的透视分析,以公平对待来自不同背景的人。
论文下载:https://scontent-hkt1-2.xx.fbcdn.net/v/t39.8562-6/166944269_1101759557004334_1049316558312568671_n.pdf
数据下载:https://ai.facebook.com/datasets/casual-conversations-downloads/
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢