您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
新鲜 正文
发私信给陈留
发送

8

AlphaGo 对李世石“放水”?棋手说不可能!

本文作者:陈留 2016-03-13 19:16
导语:李世石出人意料地挽回了胜局。那么,AlphaGo 放水的可能性有多大?

AlphaGo 对李世石“放水”?棋手说不可能!

就在舆论普遍认为李世石将会继续败北的时候,人机大战的第四场,李世石出人意料地挽回了胜局,将比分改写为“3:1”。

比赛开局阶段,李世石始终落后于 AlphaGo,一直在被吊打。然而,第78手的时候,局势峰回路转,李世石下出了关键的一步,一招极其冷门下出妙手。对于这一步棋,视频观战的职业棋手古力评价为“神之一手”。

随后,AlphaGo 一连串的差手让棋面局势利好于李世石。在第97步,AlphaGo 再次出现低级失误,所下白子被李世石果断吃掉。最终,经过长达4个多小时的鏖战之后,AlphaGo中盘认输,李世石终于在这场人机大战中赢回“尊严”之战。

AlphaGo 对李世石“放水”?棋手说不可能!

对于戏剧性的比赛结果,雷锋网编辑的朋友圈出现了有多种观点看法,其中最有代表性的一种说法是“AlphaGo 选择性放水“。甚至还有阴谋论表示,AlphaGo 今天失利是因为被改代码。那么,AlphaGo 放水的可能性有多大呢?

AlphaGo 对李世石“放水”?棋手说不可能!

雷锋网第一时间针对这一问题请教了围棋界的专业人士。对此说法, 他们都表示,“可能性为零”。至于李世石第78步的落子,完全可以称得上是载入史册的一次妙招!

业余围棋5段的赵治勋(20年棋龄,并非职业9段棋手的赵治勋)表示:

李世石创造了历史,第78步棋没有一定水平看都看不懂,很高的职业水准才能想得到。

棋手鲍云对于李世石第78步下法给予了很高的评价:

“配得上最高评价神之一手。

AlphaGo 程序在大优局面的情况下被李世石的妙手打懵了,导致在随后的20来步进入疯狗状态。鲍云表示:

AlphaGo 前半盘大优,不是防水的态度。至于AlphaGo 第97步的表现可以用“疯狗病发作”来形容。78-97步,机器应该有足够的(时间来)缓冲调整计算出局面走势。97确实是很“丢狗”的一步,说明算法还是有极大的问题,抗击打能力不足,崩溃的太脆了”。

那么,AlphaGo 为何会出现如此明显的异常表现?

根据Alphago原论文第一作者之一的Demis Hassabis 在赛后的总结,

“李世石下出白78后,AlphaGo自我感觉良好,在程序的“值网络”(用于评估电脑胜率)中,误以为胜率达到70%,直到第87步才反应过来。”

AlphaGo 对李世石“放水”?棋手说不可能!

赵治勋猜测,很可能是蒙特卡洛算法本身的一个缺陷。“78步本身是盲点,(李世石)小概率的选点,很可能导致(AlphaGo)在正确率很高的算法上出现意外事件,导致出错。”如果这一猜测成立,人类将可能找到每盘打败阿尔法的策略。而谷歌公司,将需要很长的时间来修正这一“缺陷”问题。

出门问问NLP工程师李理也在微信群给出了自己的猜测:

(如果一定要猜测)我觉得可能是开局主要靠value network,因为搜索空间太大,有可能在某些特殊的局面下出现非常差的结果。就像之前神经网络识别图片时也出现过很诡异的错误,还有人研究怎么构造让它识别出错的例子。

同时,他也认为这一“诡异”问题将会比较难解决,

神经网络打分是固定的,搜索有一定随机性。而value network是异步的,调试也不简单,得通宵加班找bug了。

PS.最新消息补充:

在赛后的记者招待会上,李世石谈到了AlphaGo的两个弱点:一个是AlphaGo执黑棋时似乎挣扎比较多,相较执白棋时更难赢。另一个是,当它遇到出其不意的招数时,有可能会导致失误,未必是失误,就是bug。

那么问题来了,第5场比赛,各位怎么看?是李世石再下一城还是AlphaGo 4:1 荣耀收关?

雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

编辑

人们总是高估短期而低估长期的科技能力!
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说