梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
强化学习大神David Silver,离开DeepMind了。
这位在DeepMind待了整整15年的元老级研究员已经出走,创办自己的AI公司Ineffable Intelligence。

根据注册文件显示,这家公司早在2025年11月就已悄然成立,Silver本人于2026年1月16日被正式任命为公司董事。
在正式离职DeepMind前的几个月里,他也一直处于休假状态。

Ineffable Intelligence总部设在伦敦,目前正在积极招募AI研究人才并寻求风险投资。

Google DeepMind的发言人证实了Silver的离职,并对其在职期间的贡献表示感谢。
除了在谷歌 DeepMind 的工作之外,Silver还是伦敦大学学院的教授,他将继续保持这一职务。

15年老兵,DeepMind的“Alpha系列”缔造者
作为强化学习团队的负责人,Silver主导或深度参与了DeepMind几乎所有里程碑式的项目。
他于2010年公司成立之初便加入,彼时DeepMind还只是一个小团队,Silver和Demis Hassabis在剑桥读大学时是老朋友,他们还一同创办过游戏公司Elixir Studios。

2016年,他领导开发的AlphaGo击败围棋世界冠军李世石,成为AI发展史上的标志性事件。
随后的AlphaZero更进一步,在不依赖任何人类棋谱的情况下,仅通过自我对弈就在围棋、国际象棋和日本将棋三个领域达到了超越人类的水平。
MuZero更加激进,能够在不被告知游戏规则的情况下掌握多种不同类型的游戏。
在即时战略游戏领域,AlphaStar成功击败了《星际争霸II》的顶尖职业玩家。
近期他还参与开发了能够解答国际数学奥林匹克竞赛题目的AlphaProof,同时也是Google首个Gemini系列AI模型研究论文的作者之一。
凭借这些成就,Silver获得了2019年度ACM计算奖和2017年度英国皇家工程院银质奖章等多项荣誉。

Silver是DeepMind员工中发表论文最多的人之一,谷歌学术统计其论文被引用超过28万次,h-index高达104。

要做“能永无止境学习”的超级智能
Silver为什么要出来单干?
据知情人士透露,他的动机是希望回归“解决AI领域最难题所带来的敬畏与奇迹”,并将超级智能视为当前最大的未解挑战。
构建一个能够自我发现所有知识基础、永无止境学习的超级智能。
在去年四月的一期播客节目中,Silver表示当前主流的大语言模型虽然强大,但其能力受限于人类已有的知识,毕竟LLM本质上是从人类产出的文本中学习的。

他倡导AI进入一个全新的“经验时代”(Age of Experience),即AI系统通过强化学习从经验中自我学习,从而发现人类未知的新事物。
这一理念的经典例证,就是2016年AlphaGo与李世石比赛中著名的第37手棋,当时所有人类专家都认为这一步是失误,但事后证明它是AlphaGo获胜的关键。
Silver认为,要实现真正的超级智能,AI必须摆脱对人类知识和直觉的依赖,从第一性原理出发进行学习。
参考链接:
[1]https://fortune.com/2026/01/30/google-deepmind-ai-researcher-david-silver-leaves-to-found-ai-startup-ineffable-intelligence/
[2]https://find-and-update.company-information.service.gov.uk/company/16865241
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
👑 年度「AI 100」产品榜单正式发布!
量子位智库通过三大板块——最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道代表产品,全面梳理2025年度国内C端AI产品的发展脉络与创新成果。

内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢