作者Jason Wei,2020年达特茅斯本科毕业,之后加入Google Brain。

博客原文地址《Practicing AI research — Jason Wei》

以下是原文(机器翻译)

我不是一个特别有经验的研究员(尽管我的头衔是“高级”研究科学家),但我与一些有才华的合作者合作,花了很多时间思考如何进行研究,所以我想我可能会写下我如何进行研究。

我的观点是:做研究是一项可以通过实践学习的技能,就像体育或音乐一样。

我分解研究的方式分为四种技能:

(1)想法构思和选择

(2)实验设计和执行

(3)撰写论文

(4)最大化影响

换句话说,好研究人员和坏研究人员的区别在于这四种技能。

 

技能1:构思和选择。

研究的第一个技能是想出或选择一个要研究的主题。这基本上是“研究品味”——每个人都应该选择让他们感到满足的研究类型,但并非所有研究品味都同样具有影响力。我喜欢简单、通用且经得起时间考验的研究主题,我尽量避免复杂、特定于任务或短暂的项目。朋友的一个好建议是(1)处理一个热门话题,并比其他人做得更好,或者(2)做一些可能成为下一个热门话题的事情。战略1风险较低,需要非常努力的工作。策略2风险更高,但可能回报很高。一开始,向经验丰富的研究人员询问他们的兴趣是合理的,并研究他们认为令人兴奋的话题。

大多数人(包括我)会因为花更多时间在想法选择上而受益匪浅,因为做好这件事对研究影响来说是一个巨大的倍增器。相反,研究一个几乎没有净空的狭窄主题,无论项目执行得多么好,都会影响。我还了解到,识别沉没成本谬误很重要——当我意识到我做医学图像人工智能研究没有获得太多牵引力时,我完全放弃了这一点,开始做NLP。

技能2:设计和执行实验。

在决定一个主题后,下一步是设计和执行实验,以表明一个想法有效,或者一个科学问题得到了回答。设计实验通常很简单,为了检查严谨性,我想向同事展示我的结果,并询问我是否遗漏了什么。快速执行实验是件好事,因为机会耗费很高,并且可以向合作者表明您致力于该项目。话虽如此,用速度换取质量是不好的,因为建立严格和全面实验的声誉很重要,即使是聪明的想法也会被混乱的执行所破坏。

技能3:写论文。

论文的撰写方式可能会极大地改变论文的接收方式。在高层,我仔细思考如何在更广泛的领域背景下构建实验结果,以便读者知道为什么结果很重要以及如何使用它们。我与合著者和非合著者进行了明确的会面,以制定论文的框架。

在较低的层面上,我花了相当多的努力来让我的论文易于理解。在为广大受众写作时,我确保提供足够的背景,以便非专家能够遵循论文的动机。大多数读者只会在推特上浏览或查看人物的屏幕截图,因此我花在摘要和介绍上的时间比论文的其他部分多,我制作的数字是独立的。我试着使用简单的单词,避免行话,因为许多人工智能研究社区不是以英语为母语的人。

技能 4:最大化影响。

最后一项技能主要在论文发表后进行,它正在最大限度地发挥你工作的影响。我认为这是最被低估的技能,也是最容易改进的技能。有很多方法可以最大限度地发挥影响力,所有这些都值得一做——在推特上宣传工作,发表演讲,在会议上发表演讲,撰写后续论文,录制YouTube视频,撰写博客文章等。推特上的广告工作可能是每笔工作量的最高回报,而且规模也相当不错。开源代码、数据或模型检查点通常值得花时间,因为它允许其他研究人员轻松地构建您的工作。

除了个人论文外,建立个人品牌也很重要。拥有一个网站当然值得花时间(是的,一些名人没有网站,我认为他们应该有)。我也开始写个人技术博客。为了强调这项技能被低估了多少,这是理查德·哈明的建议:“我相信,在我早期,你应该花在润色和演示上至少像在原始研究中一样多的时间。现在,至少有50%的时间必须用于演示。这是一个很大的数字。”

元级

以上是我认为人工智能研究的关键技能。在元层面,找到一群强大的合作者可以加快所有四项技能,因为他们可以推动您选择伟大的主题,就实验和论文写作提供反馈,并帮助推广您的工作。我获得最多里程的一件事就是不遗余力地与某些研究人员合作。虽然这可能会有点压力,但与一位非常成功的研究人员密切合作一直是培养我研究品味的良好强制作用——他们对增量想法不感兴趣。这些研究人员通常很忙,但我发现,如果你与他们的博士生(如果他们是教授)或他们管理的人(如果他们在公司)合作,他们更愿意给你时间。

除了直接合作外,我还会定期尝试识别我最钦佩的研究人员,思考我钦佩他们的原因,并尝试学习这些技能。对我来说,我最近一直是Noam Shazeer、Jacob Devlin、Jeff Dean、Percy Liang、Barret Zoph和Danqi Chen的粉丝。(从这个列表中,共同点似乎正在研究广泛的问题、高技术能力和努力工作。)

最后,我认为有中间目标很重要(最终目标应该是推进人工智能)。当我刚开始时,我的目标只是获得尽可能多的会议录取;虽然我认为像这样的目标对于申请博士课程或找工作是可以的,但我对此进行了过度优化,这导致我在2021年做了一些增量工作。仅将引用作为目标可能有点肤浅,推特参与度有点过于注重炒作。也许将输入指标(例如,工作时间)和输出指标(例如引用)结合起来更好,我没有一个完美的系统,但有具体的目标绝对可以帮助您专注于如何花费时间。

做好研究的方法肯定有很多,这只是我个人的观点和旅程。我认为这种方法很笼统,但技能2和技能4非常特定于人工智能,如果你成为教授或经理,技能就会发生变化。为了更好的建议,我喜欢Richard HammingJohn SchulmanMichael NeilsenAndrej Karpathy写的东西。

感谢Shayne LongpreHyung Won ChungJerry Wei对此的反馈。

内容中包含的图片若涉及版权问题,请及时与我们联系删除