ChatGPT的效果惊人,但不开源。显然开源社区有人憋不住了。

12月10日,LAION(代表作是赫赫有名的数据集LAION-5B)的组织者Christoph SchuhmannYannic Kilcher(AI圈知名的YouTube大V)一通视频电话,就启动了项目,很快项目的Discord讨论组就进了很多人,无比活跃起来。

最开始项目名称是open-chat-gpt,大约一周后改为Open Assistant。项目GitHub地址:

https://github.com/LAION-AI/Open-Assistant

主要贡献者,除了Yannic Kilcher之外,还有德国的Andreas Köpf(某公司的首席软件架构师)、Keith Stevens(曾在Google工作多年,生活在东京的美国人)、Birger Moëll(瑞典皇家理工学院的博士生)以及刚加入StabilityAI不久的Stephan Auerhahn

项目还处于早期,主要计划是:

我们希望按照 InstructGPT 论文中概述的 3 个步骤尽快获得初始 MVP。

1. 收集高质量的人工生成的 Instruction-Fulfillment 样本(提示 + 响应),目标 >50k。 我们设计了一个众包流程来收集和审查提示。 我们不想训练泛滥/有毒/垃圾邮件/垃圾/个人信息数据。 我们将有一个排行榜来激励社区,显示进步和最活跃的用户。将给顶级贡献者奖励。
2. 对于每个收集到的提示,我们将抽样多次完成。 一个提示的完成将随机显示给用户,以从最好到最差对他们进行排名。 同样,这应该通过众包完成,例如我们需要处理不可靠的潜在恶意用户。 至少必须收集独立用户的多次投票才能衡量整体协议。 收集的排名数据将用于训练奖励模型。
3. 现在根据提示和奖励模型进行 RLHF 训练阶段。

有兴趣参加的同学可以先在项目看板里查看有没有自己能贡献的todo,然后在这里(Google Docs表格)填写申请表。