观点

“在NLP或者机器学习领域,最坏的情况就是要与整个科学界和开源界竞争......所以,我们现在不再试图竞争,转而选择为开源界和科学界赋能。通过开源模型,可以为架构和数据库的改进提供灵感。Elastic和MongoDB就是很好的例子,它们的故事说明,初创公司可以通过某种方式为社区赋能,这种方法产生的价值,比通过搭建一个专有工具产生的价值高出上千倍......你也不需要从创造的价值中获取100%的红利,而是可以只将其中1%的价值变现,维持公司的经营。但即便只是1%,也足够成为一家高市值的公司......我相信,在机器学习领域也可以复制它们的模式......在未来5到10年,会有1-10家开源机器学习公司崛起。”

——HuggingFace联合创始人兼CEO Clément Delangue在接受《Gradient Dissent》采访是如是说。(延伸阅读

“目前我们还没有合适的语言来和人工智能交流......我们需要一种与人工智能对话的语言,以实现人工智能能在符合社会准则的基础上做出决策。这种语言......应该满足如下两个条件:

1.就像人类语言能传达人们的思想一样,这种语言要能反映机器的本质。

2.这种语言要能扩展我们已知的知识,比如帮助我们理解AlphaGo的“move 37”(击败李世石的关键一步)。”

——谷歌大脑团队成员Been Kim在2022 ICLR的主题演讲中提到。(延伸阅读

研究前沿

  1. 谷歌I/O大会发布第二代 LaMDA 对话模型,并公布PaLM多语言翻译进展
  2. Google X与伊利诺伊州立大学厄巴纳香槟分校研究者提出新方法,可为分子生成自然语言描述,或在文本的指示下从头生成新分子
  3. 华东师范大学王延昊等推荐系统社会效应的研究论文,获WWW 2022最佳论文奖
  4. AI与合成生物学“联姻”的五大挑战综述:技术、数据、算法、评估与社会影响
  5. 快手与苏黎世联邦理工推出支持百万亿参数训练的推荐系统框架Persia

机构及科学家动态

  1. Hugging Face完成C轮融资,获投1亿美元,当前估值20亿美元

本轮融资由Lux Capital领投,红杉资本、Coatue和之前的投资者 Addition、Betaworks、AIX Ventures、Kevin Durant(杜兰特)等。目前,Hugging Face Hub托管了 10万个预训练模型和1万个数据集,涵盖NLP、计算机视觉、语音、时间序列、生物学、强化学习、化学等方向和领域。公司过去一年从30人快速增加到120多人,已有超过1万家公司在使用公司的产品和服务(付费用户1000人左右)。此外,Hugging Face发起的BigScience项目,吸引了1000多名研究者一起参与。

  1. 对抗生成网络提出者Ian Goodfellow从苹果离职

Ian Goodfellow在2019年3月加入苹果,担任机器学习总监。此前,他在谷歌担任高级研究员。Ian本科与硕士就读于斯坦福大学,师从吴恩达,博士导师是图灵奖得主、机器学习三巨头之一的Yoshua Bengio。他在 2014 年 6 月提出了生成对抗网络(GAN)。这一技术成为当前机器学习领域的重点研究方向。

  1. Transformer论文五年来引用超过四万,其中六位作者创立五家公司

《Attention is all you need》(即Transformer论文)发表于 2017 年,如今引用量已经突破41000。六位作者中,Ashish Vaswani、 Niki Parmar成立AI实验室Adept,Noam Shazeer成立CharacterAI,Jakob Uszkoreit成立AI公司Inceptive,主打RNA分子设计,Aidan N. Gomez成立自然语言处理平台Cohere,已获1.7亿美元融资,Illia Polosukhin成立区块链公司Near.Protocol(原名Near.ai)。

活动

  1. 活动报名|2022智源大会开启注册,LeCun、Shamir等图灵奖得主领衔
  2. 活动报名 | 鲁继文、王利民、张力、侯淇彬、国孟昊等:视觉Transformer与Attention的前沿进展与未来趋势(5月17日)
  3. 活动报名 | ACL-IJCAI-SIGIR顶级会议论文报告会AIS 2022(5月14日-5月15日)
  4. 活动报名 | 剑桥大学刘方宇:多模态学习在何处失灵?(5月14日)
  5. 视频回放 | 宾夕法尼亚大学苏炜杰:隐私数据保护的一些进展和未来展望(5月12日)

周刊线索征集和合作,欢迎联系:editor@baai.ac.cn

内容中包含的图片若涉及版权问题,请及时与我们联系删除