这是一个研究和验证性的模型,参数700亿。主要想解决大模型对话中可能出现有害信息、不友善的口气等问题。

系统能够调用Google搜索,返回有用、信息丰富的答案。

主要思路是引入人工评估,然后应用DeepMind最擅长的强化学习进行处理。

论文(PDF)中对主要贡献的总结如下:

作者包括Demis Hassabis在内的30多人。贡献最多(同等)的四位作者是:Amelia Glaese(来自德国,佐治亚理工硕士), Nat McAleese(剑桥硕士), Maja Trebacz, John Aslanides(澳大利亚国立硕士),都是DeepMind的研究工程师,其中有两位是女性。

相关工作方面,不止一次提到了Google的LaMDA和Yuntao Bai等在Anthropic(大模型四小龙之一,出自OpenAI)的工作

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除