陈经:在AlphaGo完胜后继续分析其算法巨大优势与可能的缺陷
【今天上午,小编发出了这篇坚持分析AlphaGo弱点的文章,大约6个小时之后,李世石终于在围棋人机大战第四盘的“荣誉之战”中下出妙棋,逆袭取胜。这场来之不易的胜局几乎验证了本文的预测:要想战胜目前的AlphaGo,应该采用这样的策略,大局观要顶得住,不能早早被它控制住了。局部手段小心,不要中招。顶住以后,在开放式的接触战中等它自己犯昏。或者在局部定型中看它自己亏目。在接触战中,要利用它“不喜欢打劫”的特性,利用一些劫争的分枝虚张声势逼它让步,但又不能太过分把它逼入对人类不利的劫争中。 李世石获胜后,观察者网编辑立即采访了本文作者陈经,陈经表示,李世石78手的挖,对于人工智能算法来说,有一个劫争分枝,不一定对人有利,但这个劫争引发了AlphaGo的bug。他说,李世石今天心态非常好,开局中局一直都没有犯致命错误,顶住了。然后在中间右边的局面中发挥非常好,成功将局面导入开放式的复杂接触战。李世石78这手,就是与人对局也可以说是神之一手,很难对付。这手一出,局面非常复杂,要点非常多。电脑要计算的分支特别多。人已经确定最强变化是打劫,虽然并不一定对李世石有利。电脑由于天生的“不喜欢打劫”的特性,在这个局面模拟中,终于引发了程序中的bug。证明AlphaGo终究是基于MCTS(蒙特卡洛树搜索)的产物,虽然比之前的围棋程序zen强大很多,但一样会出现可笑的bug。之后陈经还会继续撰文分析。】 2016年3月12日人机大战第三局,AlphaGo执白176手中盘胜李世石,以3:0的比分提前取得了对人类的胜利。 这一局李世石败得最惨,早早就被AlphaGo妙手击溃,整盘毫无机会。最后李世石悲壮地造劫,在AlphaGo脱先之后终于造出了紧劫。但AlphaGo只靠本身劫就赢得了劫争,粉碎了AlphaGo不会打劫的猜想。这一局AlphaGo表现出的水平是三局中最高的,几乎没有一手棋能被人置疑的,全是好招。三局过去,AlphaGo到底实力高到什么程度,人们反而更不清楚了。 看完这三局,棋界终于差不多绝望了,原以为5:0的,都倒向0:5了。有些职业棋手在盘算让先、让二子是否顶得住。整个历程可以和科幻小说《三体》中的黑暗战役类比,人类开始对战胜三体人信心满满,一心想旁观5:0的大胜。一场战斗下来人类舰队全灭,全体陷入了0:5的悲观失望情绪中。 我也是纠结了一阵子,看着人类在围棋上被机器碾压的心情确实不好。但是承认机器的优势后,迅速完成了心理建设,又开心地看待围棋了。其实挺容易的,国际象棋界早就有这样的事了。这个可以等五盘棋过后写。 现在我的感觉是,棋界整体还是对AlphaGo的算法以及风格很不适应。一开始轻视,一输再输,姿态越来越低,三盘过后已经降到一个很低迷沉郁的心理状态了。这也可以理解,我一个围棋迷都抑郁了一会,何况是视棋如生命的职业棋手。但是不管如何,还是应该从技术的角度平心静气地搞清楚,AlphaGo到底是怎么下棋的,优势到底在哪些,是不是就没有一点弱点了?
|