OpenAI官网博客消息,任何拥有OpenAI API访问权限的人都可以用新方法来创建自己的人工智能辅助审核系统。
博客地址:https://openai.com/blog/using-gpt-4-for-content-moderation
内容审核在维持数字平台的健康方面发挥着至关重要的作用。使用GPT-4的内容审核系统可以更快地迭代政策变化,将周期从几个月缩短到几个小时。
GPT-4还能够解释长内容策略文档中的规则和细微差别,并立即适应策略更新,从而实现更一致的标签。我们相信,这为数字平台的未来提供了一个更积极的愿景,人工智能可以根据特定平台的政策帮助控制在线流量,并减轻大量人类版主的精神负担。
内容审核的挑战
内容审核需要一丝不苟的努力、敏感性、对上下文的深刻理解,以及快速适应新的用例,使其既耗时又具有挑战性。传统上,这项任务的负担落在人类主持人身上,他们筛选大量内容,以过滤出有毒和有害的材料,并得到较小的垂直特定机器学习模型的支持。这个过程本质上是缓慢的,并可能导致人类主持人的心理压力。
使用大型语言模型
我们正在探索使用LLM来应对这些挑战。我们像GPT-4这样的大型语言模型可以理解和生成自然语言,使其适用于内容审核。这些模型可以根据提供给他们的政策指导方针做出适度的判断。
有了这个系统,开发和定制内容策略的过程从几个月缩减到几个小时。
一旦制定了政策指南,政策专家可以通过识别少量示例并根据政策为其分配标签来创建一组黄金数据。
然后,GPT-4读取策略并将标签分配给相同的数据集,而没有看到答案。
通过检查GPT-4的判断与人类判断之间的差异,政策专家可以要求GPT-4在其标签背后提出推理,分析政策定义中的模糊性,解决混淆,并相应地对政策进行进一步澄清。我们可以重复步骤2和3,直到我们对政策质量感到满意。
这个迭代过程产生了精制的内容策略,这些策略被转换为分类器,从而能够大规模部署策略和内容审核。或者,为了大规模处理大量数据,我们可以使用GPT-4的预测来微调一个更小的模型。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢