ChatGPT 到底是什么?ChatGPT 是 OpenAI 训练的对话式大规模语言模型,以对话的方式进行交互。
它和之前的另一款模型 InstructGPT 属于同级模型,代表“GPT 3.5”代。之前微软和 OpenAI 签订了战略合作计划,所以 GPT 3.5 代的所有模型,包括 ChatGPT,都是在 Azure AI 超级计算集群上训练的。
OpenAI 使用前面提到的 RLHF 技术对 ChatGPT 进行了训练:简单来说,在训练原始模型的时候,OpenAI 让人类训练师扮演对话的双方(用户vs聊天机器人),提供对话作为学习资料。而在人类扮演聊天机器人的时候,OpenAI 也会让模型生成一些建议来帮助训练师撰写自己的回复。
这些机器生成的回答,再经过训练师的打分排名,将更好的结果输入回到模型中,实现强化学习训练的奖励机制。作为一个聊天机器人,ChatGPT 具有当代同类产品具备的一些主流特性,特别是多轮对话能力,能够在同一个会话期间内回答上下文相关的后续问题。但更重要的是,因为采用了先进的、注重道德水平的训练方式,ChatGPT 具有其他聊天机器人不具备或表现较差的能力:承认自己的错误,并且按照预先设计的道德准则,对“不怀好意”的提问和请求“说不”。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢