DeepMind发布安全的对话机器人系统Sparrow，700亿模型，人工+强化学习

这是一个研究和验证性的模型，参数700亿。主要想解决大模型对话中可能出现有害信息、不友善的口气等问题。

系统能够调用Google搜索，返回有用、信息丰富的答案。

主要思路是引入人工评估，然后应用DeepMind最擅长的强化学习进行处理。

论文（PDF）中对主要贡献的总结如下：

作者包括Demis Hassabis在内的30多人。贡献最多（同等）的四位作者是：Amelia Glaese（来自德国，佐治亚理工硕士）, Nat McAleese（剑桥硕士）, Maja Trebacz, John Aslanides（澳大利亚国立硕士），都是DeepMind的研究工程师，其中有两位是女性。

相关工作方面，不止一次提到了Google的LaMDA和Yuntao Bai等在Anthropic（大模型四小龙之一，出自OpenAI）的工作。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

DeepMind发布安全的对话机器人系统Sparrow，700亿模型，人工+强化学习

评论