您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
业界 正文
发私信给张驰
发送

0

柯洁为何说“输得没脾气”!8个问题解读人机大战第一局

导语:雷锋网消息,经过四个多小时的对弈,柯洁以四分之一子之差败给了Alphago。

柯洁为何说“输得没脾气”!8个问题解读人机大战第一局

雷锋网消息,经过四个多小时的对弈,柯洁以四分之一子之差败给了AlphaGo。

比赛后,曾参与训练AlphaGo的棋手樊麾,与围棋九段常昊一同回顾了整个对弈过程。柯洁也与Deepmind创始人Demis Hassabis,以及AlphaGo的主程序员David Silver一同接受了媒体采访,谈及对比赛的感想。

AlphaGo注重整体局势的发展

樊麾提到,在经过年初Master的60局比赛后,很多棋手也在尝试用点三三这种下法。而柯洁也模仿了这种开局。

常昊在分析中表示,对整个棋局印象最深的,是白棋在开局后不久第24手的大飞,这显示出AlphaGo更更注重中央势力的发展,对厚薄和棋局的发展有更多注重,因为这一步在未来棋局中的效率会更高。

AlphaGo另一个令人印象深刻的也是在开局后不久,在棋局的左上方,采取了一步断。在断之前,黑棋(柯洁)看起来很厚,但之后白棋(AlphaGo)也变得厚了。常昊称,“这是走的一步后手,但却留下了很多余味。”

柯洁为何说“输得没脾气”!8个问题解读人机大战第一局

第24手“大飞”,第54手“断”

“这一步带给了我们新的想法,有些棋不是不能下,下了以后还会有新的思路。它提供了一种思路的创新,我们可以共同去研究,为围棋的下法带来更多发展。”

虽然被围棋围住的4个字看起来已经没救了,但AlphaGo依然会更多利用这4个子,它会想把棋盘上所有子的价值都利用起来。

柯洁:输得没脾气

柯洁在回顾比赛时也对第54手的断,表示了肯定。他称,“很震惊,这在人类的下法中是不能有的”。在断之后,它把自己的脚步实地化,变得更厚,一石二鸟。

柯洁感叹道,“实在下得太出色了,输得没什么脾气。”

Demis Hassabis在赛后表示,这是一场非常精彩的比赛,他非常尊敬柯洁,这一战的表现令人佩服。他认为柯洁表现出了顽强与精彩的实力,在赛前也做了很多战前的准备。

“柯洁同时做了战略和战术的准备,比如点三三(这种策略),这是他从年初Master的60场比赛中的总结。他有自己的战略,有好几手都是非常漂亮的。第24手是全盘皆活的一手。接下来还有很多场比赛,我非常尊敬柯洁,让AlphaGo也必须用全力以赴对付你。”

比赛的结果虽然有了,但外界对AlphaGo和柯洁的好奇心没有满足。在采访中,双方也回答了很多大家关心的问题。

比赛后柯洁为什么笑了?

柯洁称,这是苦笑,不是很开心的笑。

“很早就知道自己会输。AlphaGo的每一步棋都是匀速的,到最后时已经知道会输多少了。”

对于自己的评价,柯洁称,“AlphaGo下得很精彩,但我自己也尽了全力。它下得太好了,有很多地方值得棋手去学习和探索。它对围棋的理念带来了冲击,在改变我们最初对围棋的下法,没什么棋是不能下的。对AlphaGo的想法也有改变,我们可以大胆去创新,开拓自己的思维,可以自由地去下棋。今天也是大胆地开拓了自己的思维。”

柯洁还曾想用AlphaGo的策略来对付它。“我的印象中AlphaGo是会非常贪恋实地的,比如点三三的方法,今天我也是在使用这种策略。但这种意图被AlphaGo打败了,完全进入了它的调子中。它真的下得非常的好。”

柯洁认为,AlphaGo的棋与去年完全是两个人。第一次时它很接近人的,但现在越来越像“上帝”。

AlphaGo有弱点吗?

柯洁认为,弱点暂时没有看见。以前还是有弱点的,但现在AlphaGo对棋的理解与判断已经远胜于我们人类了,赢的话只能找一些bug出来。

但他同时说,“对自己永远要有信心。”

Hassabis称,在李世石后再次参加比赛,就是希望棋手们能找到AlphaGo的弱点,找到它跟自己对弈时不知道的缺陷。

“李世石当时在第4局找到了这个缺口,后来我们改善了体系。当然还会有新的领域,我们和AlphaGo都不知道,所以才会参加比赛。”

David Silver解释称,AlphaGo的做法是将它的获胜的概率最大化,而不是接近式赢得比赛。它会寻找一些确定的路线,实现少风险的获胜机会。这也是一个取舍问题,要决定如何扩大胜利的比例。当然,它还有一些其它目标,比如将胜利的步伐迈得更大,如果重点只是放在获胜上,它可能会降低风险,即使很小的风险也会去关注。

对围棋的影响?

Hassabis认为,围棋是一个非常有意思的主题,它有无限的可能性。通过比赛,可以改进对于围棋的理解,这是我们可以用的工具,让伟大的棋手发现更多围棋的奥妙。

AlphaGo完全不依赖棋手的训练吗?

David Silver解释称,AlphaGo一开始就是跟人类来学习的,它通过自身对弈来学习时,也必须要跟人类专家对弈才行,因为与顶尖的棋手对决才能改善。新版本是更多与自身对弈来学习,实现自我的搜索,对人类数据的依赖更小了。而DeepMind的目标是让它的规则超越围棋,应用到其它领域。

战胜位于围棋顶端的柯洁后,AlphaGo是否就此隐退?

对这一问题,Hassabis没有正面回应,只是表示,本周晚些时候会宣布下一步怎么做。像第一版在学术期刊上发布了技术细节一样,他们以后也会发布更多新版本的细节,会披露更多技术细节,让其它团队与实验室做自己的版本。

技术细节?多少个TPU?单机版?

这次比赛的AlphaGo是新版本,它改善了新的算法,主要进步是计算量少了十倍,自我对弈更强。

Hassabis称,在比赛中程序是在一个单一的机器上运作的,这与去年不一样,当时是分布式的。这次有更强大的算法,运作起来更简单也更好,获得的速度更快。

Hassabis表示,计算力可以“在Google云中获得,用的是TPU,十个处理单位,少了十倍的计算量”。简单点说,这次的AlphaGo是单机版。

柯洁再也不与人工智能比了?

赛前,柯洁发微博表示,这次比赛是最后三场与人工智能的比赛。赛后,他对这一决定再次做了确认。

“考虑了很久,AlphaGo进步太快了,每一步都是巨大的进步,在以后会更加完美,而人与它的差距不是靠自己的努力就能去弥补的。我相信科技的力量,未来是人工智能的。对围棋来说,我还是喜欢和人来下,因为机器与人的差距会越来越大,人赢的概率会越来越小,这样下棋太痛苦了,一盘都赢不了。”

他表示,以后也不会去训练机器了,这是最后的三盘棋。

“希望以后还是下人类的棋,对软件把它当作一个老师,一个学习的对象去看待。”

他表示,对自己的表现也有点不满意,觉得自己可以做得更好,但有时候无论怎么努力都无法做到。所以这最后一次,他希望不留遗憾,下出让自己满意的棋局。

“令AlphaGo的主机发烫也好。” 

那如果人类棋手不想和AlphaGo打了怎么办?

Hassabis表示,从他们的角度来说,想要AlphaGo作为围棋的工具,能为人类所用,所以会有架构知识的分享,让大家知道它。也希望它能走进寻常百姓家,在医学与科学找到应用场景。

雷锋网雷锋网

雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

专业写瞎

不受意识控制地报道那些让人感动的产品技术和事件......zhchsimons@gmail.com ;微信:nksimons;《脑洞》公众号:hackmind
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说