Facebook RIO 系统| 训练 AI 检测仇恨言论

Facebook 建立并部署了一个名为 Reinforcement Integrity Optimizer（RIO）的创新系统，用于改善仇恨语音检测模型。

仇恨言论因国家、群体而异，可以根据时事或趋势迅速发展，人们还会试图以讽刺、故意拼写错误以及复杂照片更改来掩饰其仇恨言论。有效的仇恨语音检测工具不仅需要发现问题，还要能避免错误。

RIO 是一个端到端的优化强化学习（RL）框架，用于优化仇恨语音分类器，以自动查看上传到 Facebook 和 Instagram 的所有内容。

AI 分类系统通常是离线培训的，而 RIO 采用了一种新的方法，引导模型直接从数百万条当前内容中学习，并使用在线指标作为奖励信号来优化 AI 模型的开发，包括数据，功能、架构和参数，它能够不断评估自己的工作表现，并不断学习和适应以使平台更加安全。

内容中包含的图片若涉及版权问题，请及时与我们联系删除