哈萨比斯首次解读AlphaZero被当场diss，没想到他起身当面回击

夏乙 2017-12-08 21:45:30 来源：量子位

夏乙假装发自长滩

量子位出品 | 公众号 QbitAI

有争论才有意思。昨天是机器学习“炼金术”，今天则是AlphaZero。

在NIPS大会期间，DeepMind创始人兼CEO哈萨比斯（Demis Hassabis）出席（并且赞助）了一个研讨会。在这个活动上，哈萨比斯首次公开解读了他们最新的研究成果AlphaZero。

（当然，还被后面登场的嘉宾diss了……）

哈萨比斯首次解读AlphaZero被当场diss，没想到他起身当面回击

哈萨比斯在演讲中首先提到DeepMind背后的哲学，这家公司奉行的第一性原理。回顾了AlphaGo在此前比赛中的表现，特别是那些具有“独创性”的时刻。

至于最新的AlphaZero，哈萨比斯坦言结果出乎他们预料。DeepMind本来认为手动调整的国际象棋引擎Stockfish已经接近最优解，但没想到AlphaZero还是在24之内，通过不断地自我对弈，最终击败了Stockfish。

当然不只是击败了一个国际象棋程序，AlphaZero还横扫了日本将棋程序Shogi，以及刚刚创下佳绩的围棋程序AlphaGo Zero。

哈萨比斯首次解读AlphaZero被当场diss，没想到他起身当面回击

在国际象棋比赛中，AlphaZero的棋风，既不像人、也不像电脑。

哈萨比斯介绍说，AlphaZero偏爱远期的局面性弃子，没有子力的概念。AlphaZero会根据当前的局面进行判断，相较而言，如果使用了刚性规则就无法动态调整策略。人类可以向AlphaZero学习国际象棋的战略，而不是战术。

当然，哈萨比斯也没忘了问一句：人类关于国际象棋的知识是不是太有限了？（╭(╯^╰)╮）

哈萨比斯首次解读AlphaZero被当场diss，没想到他起身当面回击

说句题外话，关于这次的AlphaZero，固然又给DeepMind挣了脸，但是奇怪之处在于，有关AlphaZero的研究，论文只在arxiv上“草草”发出了事。

既没有发Nature，也没有投会议。甚至DeepMind官方博客、推特等渠道，也没有专门发文提及此事。

这不像DeepMind既有技术，又擅长“炒作”的风格呀……

马库斯当场Diss哈萨比斯

安妮薇，对于DeepMind最新搞出的AlphaZero，有人溢于言表的赞美。当然也有人一万个不爽。

比方，纽约大学的马库斯老师（Gary Marcus）。他是纽约大学心理学和神经科学教授，所涉猎的领域包括人类和动物行为、神经科学、人工智能。马库斯还曾担任Uber AI实验室的负责人（主要他的AI创业公司被Uber收购了）。

哈萨比斯讲完后不久，马库斯登台。他很快指出：DeepMind令人惊叹的结果，仍然依赖于一些人类知识，比方使用了蒙特卡洛树搜索。

哈萨比斯首次解读AlphaZero被当场diss，没想到他起身当面回击

接着，他提出一个“理论”：认知（Cognition）可以视为三个变量的函数，写成公式就是：Cognition = f (a,k,e)。其中a代表先天算法，k代表先天知识，e代表经验。

“DeepMind已经非常令人信服的表明，即便k值接近于0（zero），也能获得出色的认知表现”，马库斯表示。

不过你有没有发现，马库斯实际上用公式写了一个大大的单词：fake。

哈萨比斯首次解读AlphaZero被当场diss，没想到他起身当面回击

马库斯对于DeepMind以及AlphaGo的主要抨击点在于，哈萨比斯等人的工作，低估了对人类知识和特定领域的需求。

哈萨比斯首次解读AlphaZero被当场diss，没想到他起身当面回击

马库斯主张人类拥有先天的知识，而神经网络基本不具备。他认为在特定领域的专长，不等于先天性。他举了几个例子，例如膝跳反射、人脸识别、国际象棋都是特定领域的能力，但先天性方面各自不同。

而通用智能不分领域，有部分是天生的。

马库斯指出，如何认知对象等等能力，可能都是进化所赋予人类的天生能力（当然也有观点说这些都不是天生的）。

“生命不是一场Kaggle竞赛”。

马库斯表示，生命是一场训练集（training set），没有什么是预先准备好的整齐数据，很多情况都无法预测。在这个过程中，每天的挑战都不一样，真正应该重视的是那些可以用在多个挑战领域的知识。

哈萨比斯当面回击

其实马库斯有点看什么都不满意的习惯，之前马库斯还跟LeCun等人公开叫板。只不过这一次，他diss的对象，就坐在台下。

于是最劲爆的一幕出现了。

哈萨比斯听完马库斯的一番言论，然后当场起身开始了回击。哈萨比斯表示，DeepMind并不是反对先天知识，他们方法已经远超完美信息博弈的范畴，而且整合了神经科学、认知心理学的原理。

哈萨比斯的回击，全程动图如下。（视频全程，我们放在量子位微信公号上了）

哈萨比斯首次解读AlphaZero被当场diss，没想到他起身当面回击

OMT

关于AlphaGo、AlphaZero的争论，让量子位想起不久前看到的一篇论文。论文的题目是AlphaGo祛魅：《Demystifying AlphaGo Zero as AlphaGo GAN》。

这篇论文的作者是南京东南大学的几位学者：

董晓，副教授，影像科学与技术系
伍家松，讲师，影像科学与技术系
周玲，副教授，计算机工程系

他们在这篇论文中指出：

AlphaGo Zero的惊人成功，在全球范围内引发了对人类社会未来的讨论，期间夹杂着希望、焦虑、兴奋和恐惧混合的情绪。

我们尝试对AlphaGo Zero去魅，通过定性分析表明AlphaGo Zero可以被理解为特定结构的GAN（生成对抗网络），这个系统本应具有良好的收敛性。

因此，我们认为AlphaGo Zero的成功，可能不是新一代AI的标志。

可能影响AlphaGo Zero性能的因素包括：1、围棋的固有属性 2、AlphaGo Zero的结构（基于ResNet的价值和策略网络，MCTS和强化学习）

这篇论文中，我们通过指出AlphaGo Zero可以被理解为一个具有良好收敛预期的特殊GAN，来试图定性的回答这个问题。

如果你对这篇论文感兴趣，可以在量子位微信公众号后台回复：“祛魅”两个字，就能获得相关的下载地址。

文中的现场图文、视频来自推特账号：@thinkmariya、@willknight等。

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ’ᴗ’ ի 追踪AI技术和产品新动态

夏乙

14年，50%市场份额，一家中国公司何以在丹麦成功？2019-03-06
百度正用谷歌AlphaGo，解决一个比围棋更难的问题2019-03-06
全球首例无人车撞人致死事故判决：Uber无罪，安全员要进一步调查2019-03-06
SpaceX载人龙飞船意外爆炸，据称几乎被完全摧毁2019-04-22

哈萨比斯首次解读AlphaZero被当场diss，没想到他起身当面回击

马库斯当场Diss哈萨比斯

哈萨比斯当面回击

OMT

热门文章

雷军：地表最强四门车，小米造！自曝造车起步估值超700亿

陶哲轩在IMO上给AI团队颁奖！他们要做AI数学的ImageNet

给iPhone背面贴个AI录音机，生意老好了

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

微软蓝屏搞瘫全球，马斯克很生气，原因很尴尬