Facebook 建立并部署了一个名为 Reinforcement Integrity Optimizer(RIO)的创新系统,用于改善仇恨语音检测模型。

仇恨言论因国家、群体而异,可以根据时事或趋势迅速发展,人们还会试图以讽刺、故意拼写错误以及复杂照片更改来掩饰其仇恨言论。有效的仇恨语音检测工具不仅需要发现问题,还要能避免错误。

RIO 是一个端到端的优化强化学习(RL)框架,用于优化仇恨语音分类器,以自动查看上传到 Facebook 和 Instagram 的所有内容。

AI 分类系统通常是离线培训的,而 RIO 采用了一种新的方法,引导模型直接从数百万条当前内容中学习,并使用在线指标作为奖励信号来优化 AI 模型的开发,包括数据,功能、架构和参数,它能够不断评估自己的工作表现,并不断学习和适应以使平台更加安全。

点击此处,了解更多

内容中包含的图片若涉及版权问题,请及时与我们联系删除