近日,DeepMind的首席科学家、AlphaGo首席研究员David Silver接受了《连线》杂志的采访,讨论了MuZero、强化学习以及对未来通用人工智能的看法。

关于MuZero 本周,DeepMind的MuZero通过了同行评审,发表在了最新一期的Nature杂志上。MuZero是一个通用的游戏AI,它在围棋、象棋、将棋和57款Atari游戏上都超过了人类的表现。而且这个AI事先不需要事先知道规则。

David Silver认为,MuZero向前迈出的重要一步是,我们没有告诉它环境的动态。它必须自己想办法,让自己提前计划,想出最有效的策略。我们希望拥有在现实世界中可以运行的算法,而现实世界却是复杂、混乱且未知的。所以你不能只向前看,就像下棋一样。你必须学会这个世界是如何运转的。

关于强化学习 David Silver认为,一个真正强大的系统,可以看到你看到的所有事物,具有与你相同的感官,能够帮助你实现人生目标。

关于强化学习走向通用人工智能 David Silver说:“有一个假设,我们称其为“奖励足够”假设。这个假设说,智能的基本过程可以像一个寻求最大化其奖励的系统一样简单,而试图实现目标并试图最大化奖励的过程,足以产生我们在自然智能中看到的所有智能属性。”、“你可以认为强化学习是一种能力,它使一个智能体能够获得所有需要的其他能力。”

英文链接:https://www.wired.com/story/what-alphago-teach-how-people-learn/

内容中包含的图片若涉及版权问题,请及时与我们联系删除