中文NLP社区也迎来了自己的ChatGPT,最近元语智能开发团队训练了一个叫做元语AI(ChatYuan)的模型,它通过对话形式进行交互:可以回答问题,具有联系上下文的能力;可以写文章、写作业、写诗歌、做中英文间的翻译;一些法律等特定领域问题也可以提供相关信息。

ChatYuan是开源模型PromptCLUE的兄弟模型,它是一个全中文任务支持零样本学习模型,用户通过提供提示方式来使用,支持文本生成、信息抽取和理解大类下近30多种中文任务。比如,下面这个情景式对话:

 

(原来机器人买房也缺钱)

目前研究阶段ChatYuan是完全免费的,可以在网页版www.YuanYu.ai中体验,也可以在微信搜索小程序「元语智能」进行体验。
元语AI是怎么做的:我们是在PromptCLUE模型基础上,使用对话数据进一步训练。它基于的版本是100亿规模参数的模型,然后进一步使用1亿级对话数据进行训练,用到的训练算力相当于500张V100训练一个月。它使用多任务形式同时训练单轮对话、多轮对话、语言模型和解码模块,可以到这里查看基础模型的进一步信息:https://github.com/clue-ai/PromptCLUE
 
部分示例通过使用尝试机制,多次使用生成,后续版本将更好的支持多轮对话以及话题切换,以及通过人类反馈学习进一步增强模型生成更加符合用户意图的内容。原理上,ChatYuan已经可以实现很多功能,而且效果也很不错了。但相比于ChatGPT来说,还有至少1-2年的差距。
 
作者表示,如果把ChatGPT比作是量产3纳米芯片的话,ChatYuan可能还处在量产20纳米的阶段。