专访AlphaGo“教练”：要不要和中国选手比一场

发布时间：2016-07-31 20:52:07 所属栏目：专访来源：腾讯科技

导读：在AlphaGo还没有被李世石逆转之前，新浪科技在当天上午专访了DeepMind巩固学习小组负责人大卫·席尔瓦(David Silver)。在两个月前，《自然》杂志刊登的那篇论文上，有两个

AlphaGo 教练中国选手

3月13日，哈萨比斯(中)与大卫·席尔瓦(右)在赛后发布会上向李世石庆祝战胜AlphaGo。

新浪科技周峰

在AlphaGo还没有被李世石逆转之前，新浪科技在当天上午专访了DeepMind巩固学习小组负责人大卫·席尔瓦(David Silver)。在两个月前，《自然》杂志刊登的那篇论文上，有两个名字处在了第一作者的位置。一个是比赛赛场坐在李世石对面，替AlphaGo落子的黄士杰。另外一个作者的名字就是他。

实际上，作为AlphaGo团队的技术负责人，席尔瓦完全可以称得上是一个“教练”级的角色。在接近半个小时的专访里，我们了解到了AlphaGo如何走出一手“神来之笔”，怎样和李世石进行赛后交流、以及有没有和聂卫平比一场的想法——而且不止聂老，这个挑战名单上还有马晓春、常昊、古力、柯洁……

　　新浪科技：作为AlphaGo的开发者，DeepMind的员工下围棋吗？

大卫·席尔瓦：我是业余水平。可能只有业余一级。

我们团队里下得最好的是黄士杰，就是代替AlphaGo和李世石下棋的那位。在DeepMind，我的同事们都开始对围棋产生兴趣，很多人开始下围棋，学习规则。我们还有一个围棋俱乐部，大家玩得都很开心。但我觉得最棒的事情是AlphaGo引起了整个西方世界学习围棋兴趣，我很高兴，希望西方可以更多了解这项智力运动的魅力。

新浪科技：我们看到很多韩国媒体都在报道人工智能技术，希望能够推动这一技术的进展。我觉得在推广科技方面，你们也做了同样的事情。

大卫·席尔瓦：我希望如此。

　　新浪科技：AlphaGo和李世石比赛这几天，是不是还在进行自我训练？

大卫·席尔瓦：AlphaGo对战李世石的比赛之前，我们已经暂停了AlphaGo的研发。因为我们需要决定用哪个版本来与李世石对战，我们还需要进行测试，小心确保所有事情都能顺利进行。所以我们不会在对战过程中改变版本。如果李世石在比赛中采用新策略的话，我们也不会从中学习的。

其实这几场比赛所提供的数据也不足以提高AlphaGo的能力，之前的学习能力都是通过几十万场比赛获得的，一两场比赛的意义并没有那么大。

　　新浪科技：从AlphaGo的开发者的角度出发，你觉得李世石的前三场比赛表现如何？

大卫·席尔瓦：我觉得他对AlphaGo比赛风格的适应能力比AlphaGo对适应他的能力高多了。李世石天赋很高，力量很大，我很高兴看到他只根据一两场对弈的经验，就在过去几场比赛中分别找到了不同的方式来试探AlphaGo的能力。

新浪科技：李世石每次认输之后的状况都很不好，部分原因可能是他很难和电脑沟通。人类棋手在比赛之后都会一起复盘，看看对方在比赛时是怎么思考的。我很好奇DeepMind有没有把数据反馈给他，帮助他从比赛中学习？

大卫·席尔瓦：这是个好问题。因为我们对职业围棋不太了解，所以我觉得我们还没能理解，赛后分析对棋手来说有多重要。所以我们也还没有开发与能李世石进行交流的程序，目前来看这项工作还是非常难的。

我觉得我们可能会在比赛之后，找一个时间，和李世石共同了解一下AlphaGo对棋局的分析，看看双方会不会有什么交流。我觉得这是意见很好的事情。但比赛之前我们没有意识到这点。不过实际上，我们了解到这件事有多重要，所以我们也邀请了他，问他如果可能，也愿意的话，希望他能邀请他的助手，还有更多的专业棋手参与进来，和他一起来分析比赛。这样的话，就不是他一个人孤军奋战了。

　　新浪科技：Facebook也在研究围棋方面的人工智能，而且他们的团队用自己的算法分析了这几天的比赛，并给出了每盘比赛的关键步，你怎么看待他们的研究？

大卫·席尔瓦：我也看到其他优秀程序在这方面的分析了，比如Crazy Stone等等。我对看其他围棋程序怎么思考很感兴趣，就像有优秀分析能力的人类棋手也对其他棋手的想法感兴趣一样。我觉得，对比赛过程有很多不同方面的观点，这是件好事。当然，AlphaGo对于谁的胜算更大，有自己的判断，李世石也是这样。

新浪科技：很多职业棋手都说AlphaGo在第二局比赛里的第37手棋不像是人类会下的棋，它是怎么下出来这手棋的？

大卫·席尔瓦：其实，我第二局比赛结束之后，看了下AlphaGo。因为我知道很多职业棋手都觉得AlphaGo的第37手棋下得不同凡响，所以我后来专门查看了下AlphaGo。

有意思的是，职业棋手都说没有人类能下出这手棋，人类能下出这样一手棋的可能性极小。所以我就问了AlphaGo，因为它有人类棋谱的模型，它其实是在向人类学习的。AlphaGo说它觉得人类会下出来这步棋，概率是万分之一。

所以它其实知道这手棋人类不太可能会下，但它同时对位置进行了分析，并且根据自己的理解，通过更深层次的评估，相信这手棋的力量很大。虽然它的能力来自对人类棋手的学习，这样一步棋可能已经意味着它已经准备好超越人类，创造和发现新的风格和棋路。

　　新浪科技：DeepMind创始人哈萨比斯前两天接受采访的时候提到过会开发新版本的AlphaGo，让它从0开始学习围棋，不会借鉴任何人类棋谱。这个版本的AlphaGo与目前的版本会有什么不同？

大卫·席尔瓦：在未来，我们对(AlphaGo)能否从完全没有人类专业经验，纯粹自学很感兴趣。如果我们能开发出这样一个AlphaGo的话，我们或许就会发现风格相当不一样的下法。不过这个事情很难。

目前和李世石比赛的这个版本，仍然从人类经验中吸取了大量的原型数据，帮助它开始学习。所以我觉得这是个非常有趣的挑战。不过距离实现还有很长的路要走。

　　新浪科技：聂卫平觉着AlphaGo在这几场中的表现非常不错，他还表示要对AlphaGo在第二局比赛中的第37手棋脱帽致敬。

大卫·席尔瓦：听到这件事我很荣幸。非常感谢你告诉我。

　　新浪科技：聂卫平对前50步之内保持对AlphaGo的优势非常自信，他个人也想和AlphaGo较量一下。而且不止聂卫平，马晓春、常昊、古力、柯洁在内的顶级棋手都想与AlphaGo过招，甚至愿意组队与AlphaGo对弈。AlphaGo有没有考虑过接受其他职业棋手的挑战？

大卫·席尔瓦：实话说，我们目前主要是考虑的还是这场比赛，我们对目前取得的结果也很高兴，我们已经三比零领先。

我们通常认为，我们应该在决定AlphaGo将来做什么之前，等一等，看一看。因为我们真不知道它和世界顶级棋手比赛时，到底会出现什么情况。我们也在讨论下一步的计划，也在讨论接下来让AlphaGo干什么。

对于大家对人工智能的兴趣，以及大家想要和AlphaGo交流的情况，我们很高兴。我们会尽快作出决定。

　　新浪科技：和李世石比赛之后，有这么多职业棋手想要挑战AlphaGo，你是怎么看待这件事的？

（编辑：常州站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

1/2

尾页