这是一个研究和验证性的模型,参数700亿。主要想解决大模型对话中可能出现有害信息、不友善的口气等问题。
系统能够调用Google搜索,返回有用、信息丰富的答案。
主要思路是引入人工评估,然后应用DeepMind最擅长的强化学习进行处理。
论文(PDF)中对主要贡献的总结如下:
作者包括Demis Hassabis在内的30多人。贡献最多(同等)的四位作者是:Amelia Glaese(来自德国,佐治亚理工硕士), Nat McAleese(剑桥硕士), Maja Trebacz, John Aslanides(澳大利亚国立硕士),都是DeepMind的研究工程师,其中有两位是女性。
相关工作方面,不止一次提到了Google的LaMDA和Yuntao Bai等在Anthropic(大模型四小龙之一,出自OpenAI)的工作。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢