2017年,当Google研发出Transformers时,计算机理解和生成语言的能力有了巨大提升。其部分团队成员,后来通过位于多伦多的初创公司Cohere独立发展——Cohere由Google Brain加拿大团队的两名成员Aidan Gomez和Nick Frosst(以及第三名联合创始人Ivan Zhang)在两年前成立,以进一步开发和商业化模型,通过API交付客户。该公司今天宣布了4000万美元的A轮融资。
整个初始团队都很年轻,本科均来自多伦多大学。
Aidan Gomez是2013级的,2018年刚开始在牛津读博士,导师是Yarin Gal和Yee Whye Teh。他是Attention Is All You Need论文的作者之一(8位作者同等贡献),与Łukasz Kaiser的具体贡献是:spent countless long days designing various parts of and implementing tensor2tensor, replacing our earlier codebase, greatly improving results and massively accelerating our research.
第二位创始人Ivan Zhang是2014级而且辍学了。
第三位创始人Nick Frosst多伦多大学2011级,也没有继续深造。
只有研发总监Rodrigue Hajjar岁数大一点。2010年本科毕业,此前在McAfee做研发总监。
Cohere得到了Geoffrey Hinton和李飞飞等人支持。Hinton在给Fast Company的一份声明中说:
大语言模型现在让计算机对人类交流有了更好的理解,Cohere团队正在构建的技术,将使自然语言理解方面的这场革命更加广泛。
去年,对NLP大模型的批评者提出了担忧,这些训练模型的技术会无意中捕捉到数据中的固有偏见。Cohere首席执行官Aidan Gomez说,他的公司已经开发了新工具,并投入大量时间,确保模型不会摄入不良数据。为了应对风险,Cohere公司的工程师已经实施了质量控制测试,在发布之前寻找模型的问题,发布之后也将继续监测。此外,Cohere公司将发布“数据声明”,其中将包括有关训练数据、其局限性和风险信息——这是Timnit Gebru推广的概念。Cohere还成立了一个外部责任委员会,帮助监督安全应用。
Gomez说,模型的问题之一,是需要大量训练数据和计算能力来运转,Cohere想做的是为普通用户提供他们无法获得的超级计算能力,否则基于这项技术构建产品就没有可能。
Cohere正在为聊天机器人独角兽公司Ada提供NLP能力。Ada已经尝试使用Cohere的自然语言模型,将客户的聊天请求与现有的支持信息相匹配。Gomez说,Cohere的模型不是试图预测一个请求的所有可能措辞,而是试图理解它背后的意图。
Cohere模型与GPT-3有一些区别,Gomez解释说。GPT-3是一个“生成”模型,旨在根据用户提示,创建从左到右的文本——类似强大的自动完成功能。但这只是许多自然语言功能中的一个,Cohere提供了一个包含NLP功能的“全栈”平台,包括情感分类、问题回答和文本分类。
Cohere将利用这笔融资,将员工数量扩展到50人,并扩大其NLP平台,以服务新行业,如医疗保健和金融服务。Index Ventures领投了这一轮,其合伙人Mike Volpi亦加入了Cohere董事会。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢