OpenAI ChatGPT：行走的代码生成器

ChatGPT 到底是什么？ChatGPT 是 OpenAI 训练的对话式大规模语言模型，以对话的方式进行交互。

它和之前的另一款模型 InstructGPT 属于同级模型，代表“GPT 3.5”代。之前微软和 OpenAI 签订了战略合作计划，所以 GPT 3.5 代的所有模型，包括 ChatGPT，都是在 Azure AI 超级计算集群上训练的。

OpenAI 使用前面提到的 RLHF 技术对 ChatGPT 进行了训练：简单来说，在训练原始模型的时候，OpenAI 让人类训练师扮演对话的双方（用户vs聊天机器人），提供对话作为学习资料。而在人类扮演聊天机器人的时候，OpenAI 也会让模型生成一些建议来帮助训练师撰写自己的回复。

这些机器生成的回答，再经过训练师的打分排名，将更好的结果输入回到模型中，实现强化学习训练的奖励机制。作为一个聊天机器人，ChatGPT 具有当代同类产品具备的一些主流特性，特别是多轮对话能力，能够在同一个会话期间内回答上下文相关的后续问题。但更重要的是，因为采用了先进的、注重道德水平的训练方式，ChatGPT 具有其他聊天机器人不具备或表现较差的能力：承认自己的错误，并且按照预先设计的道德准则，对“不怀好意”的提问和请求“说不”。

更多内容请查看：https://mp.weixin.qq.com/s/DXzZ_5RrRbVe5bWkpwFV6Q

内容中包含的图片若涉及版权问题，请及时与我们联系删除

OpenAI ChatGPT：行走的代码生成器

评论列表

评论