加入收藏 | 设为首页 | 会员中心 | 我要投稿 常州站长网 (https://www.0519zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 人物访谈 > 专访 > 正文

专访AlphaGo“教练”:要不要和中国选手比一场

发布时间:2016-07-31 20:52:07 所属栏目:专访 来源:腾讯科技
导读:在AlphaGo还没有被李世石逆转之前,新浪科技在当天上午专访了DeepMind巩固学习小组负责人大卫·席尔瓦(David Silver)。在两个月前,《自然》杂志刊登的那篇论文上,有两个

AlphaGo 教练 中国选手

3月13日,哈萨比斯(中)与大卫·席尔瓦(右)在赛后发布会上向李世石庆祝战胜AlphaGo。

新浪科技 周峰

在AlphaGo还没有被李世石逆转之前,新浪科技在当天上午专访了DeepMind巩固学习小组负责人大卫·席尔瓦(David Silver)。在两个月前,《自然》杂志刊登的那篇论文上,有两个名字处在了第一作者的位置。一个是比赛赛场坐在李世石对面,替AlphaGo落子的黄士杰。另外一个作者的名字就是他。

实际上,作为AlphaGo团队的技术负责人,席尔瓦完全可以称得上是一个“教练”级的角色。在接近半个小时的专访里,我们了解到了AlphaGo如何走出一手“神来之笔”,怎样和李世石进行赛后交流、以及有没有和聂卫平比一场的想法——而且不止聂老,这个挑战名单上还有马晓春、常昊、古力、柯洁……

  新浪科技:作为AlphaGo的开发者,DeepMind的员工下围棋吗?

大卫·席尔瓦:我是业余水平。可能只有业余一级。

我们团队里下得最好的是黄士杰,就是代替AlphaGo和李世石下棋的那位。在DeepMind,我的同事们都开始对围棋产生兴趣,很多人开始下围棋,学习规则。我们还有一个围棋俱乐部,大家玩得都很开心。但我觉得最棒的事情是AlphaGo引起了整个西方世界学习围棋兴趣,我很高兴,希望西方可以更多了解这项智力运动的魅力。 

新浪科技:我们看到很多韩国媒体都在报道人工智能技术,希望能够推动这一技术的进展。我觉得在推广科技方面,你们也做了同样的事情。

大卫·席尔瓦:我希望如此。

  新浪科技:AlphaGo和李世石比赛这几天,是不是还在进行自我训练?

大卫·席尔瓦:AlphaGo对战李世石的比赛之前,我们已经暂停了AlphaGo的研发。因为我们需要决定用哪个版本来与李世石对战,我们还需要进行测试,小心确保所有事情都能顺利进行。所以我们不会在对战过程中改变版本。如果李世石在比赛中采用新策略的话,我们也不会从中学习的。

其实这几场比赛所提供的数据也不足以提高AlphaGo的能力,之前的学习能力都是通过几十万场比赛获得的,一两场比赛的意义并没有那么大。

  新浪科技:从AlphaGo的开发者的角度出发,你觉得李世石的前三场比赛表现如何?

大卫·席尔瓦:我觉得他对AlphaGo比赛风格的适应能力比AlphaGo对适应他的能力高多了。李世石天赋很高,力量很大,我很高兴看到他只根据一两场对弈的经验,就在过去几场比赛中分别找到了不同的方式来试探AlphaGo的能力。

新浪科技:李世石每次认输之后的状况都很不好,部分原因可能是他很难和电脑沟通。人类棋手在比赛之后都会一起复盘,看看对方在比赛时是怎么思考的。我很好奇DeepMind有没有把数据反馈给他,帮助他从比赛中学习?

大卫·席尔瓦:这是个好问题。因为我们对职业围棋不太了解,所以我觉得我们还没能理解,赛后分析对棋手来说有多重要。所以我们也还没有开发与能李世石进行交流的程序,目前来看这项工作还是非常难的。

我觉得我们可能会在比赛之后,找一个时间,和李世石共同了解一下AlphaGo对棋局的分析,看看双方会不会有什么交流。我觉得这是意见很好的事情。但比赛之前我们没有意识到这点。不过实际上,我们了解到这件事有多重要,所以我们也邀请了他,问他如果可能,也愿意的话,希望他能邀请他的助手,还有更多的专业棋手参与进来,和他一起来分析比赛。这样的话,就不是他一个人孤军奋战了。

  新浪科技:Facebook也在研究围棋方面的人工智能,而且他们的团队用自己的算法分析了这几天的比赛,并给出了每盘比赛的关键步,你怎么看待他们的研究?

大卫·席尔瓦:我也看到其他优秀程序在这方面的分析了,比如Crazy Stone等等。我对看其他围棋程序怎么思考很感兴趣,就像有优秀分析能力的人类棋手也对其他棋手的想法感兴趣一样。我觉得,对比赛过程有很多不同方面的观点,这是件好事。当然,AlphaGo对于谁的胜算更大,有自己的判断,李世石也是这样。

新浪科技:很多职业棋手都说AlphaGo在第二局比赛里的第37手棋不像是人类会下的棋,它是怎么下出来这手棋的?

大卫·席尔瓦:其实,我第二局比赛结束之后,看了下AlphaGo。因为我知道很多职业棋手都觉得AlphaGo的第37手棋下得不同凡响,所以我后来专门查看了下AlphaGo。

有意思的是,职业棋手都说没有人类能下出这手棋,人类能下出这样一手棋的可能性极小。所以我就问了AlphaGo,因为它有人类棋谱的模型,它其实是在向人类学习的。AlphaGo说它觉得人类会下出来这步棋,概率是万分之一。

所以它其实知道这手棋人类不太可能会下,但它同时对位置进行了分析,并且根据自己的理解,通过更深层次的评估,相信这手棋的力量很大。 虽然它的能力来自对人类棋手的学习,这样一步棋可能已经意味着它已经准备好超越人类,创造和发现新的风格和棋路。

  新浪科技:DeepMind创始人哈萨比斯前两天接受采访的时候提到过会开发新版本的AlphaGo,让它从0开始学习围棋,不会借鉴任何人类棋谱。这个版本的AlphaGo与目前的版本会有什么不同?

大卫·席尔瓦:在未来,我们对(AlphaGo)能否从完全没有人类专业经验,纯粹自学很感兴趣。如果我们能开发出这样一个AlphaGo的话,我们或许就会发现风格相当不一样的下法。不过这个事情很难。

目前和李世石比赛的这个版本,仍然从人类经验中吸取了大量的原型数据,帮助它开始学习。所以我觉得这是个非常有趣的挑战。不过距离实现还有很长的路要走。

  新浪科技:聂卫平觉着AlphaGo在这几场中的表现非常不错,他还表示要对AlphaGo在第二局比赛中的第37手棋脱帽致敬。

大卫·席尔瓦:听到这件事我很荣幸。非常感谢你告诉我。

  新浪科技:聂卫平对前50步之内保持对AlphaGo的优势非常自信,他个人也想和AlphaGo较量一下。而且不止聂卫平,马晓春、常昊、古力、柯洁在内的顶级棋手都想与AlphaGo过招,甚至愿意组队与AlphaGo对弈。AlphaGo有没有考虑过接受其他职业棋手的挑战?

大卫·席尔瓦:实话说,我们目前主要是考虑的还是这场比赛,我们对目前取得的结果也很高兴,我们已经三比零领先。

我们通常认为,我们应该在决定AlphaGo将来做什么之前,等一等,看一看。因为我们真不知道它和世界顶级棋手比赛时,到底会出现什么情况。我们也在讨论下一步的计划,也在讨论接下来让AlphaGo干什么。

对于大家对人工智能的兴趣,以及大家想要和AlphaGo交流的情况,我们很高兴。我们会尽快作出决定。

  新浪科技:和李世石比赛之后,有这么多职业棋手想要挑战AlphaGo,你是怎么看待这件事的?

(编辑:常州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读