首页 AI财经社 内文

比柯洁输棋更绝望的是,人类已经找不到AlphaGo的弱点

2017年5月23日 文/ 卢华磊 编辑/ 唐晓园

面对如今的AlphaGo,柯洁只输了1/4子。“它的弱点暂时没有看见。我觉得以前AlphaGo还是有弱点的,但现在它对棋的理解和判断远胜于我们了。”

一个月前,柯洁说AlphaGo是“来自未来的人”,但今天,他说“现在它(AlphaGo)的棋和去年完全两个人,去年还是比较接近人了,而今年完全不一样,我理解中它是围棋上帝了。”

柯洁惜败。

5月23日,在乌镇召开的“中国乌镇.围棋峰会”上,中国围棋职业九段棋手,现世界围棋排名网站GoRatings位列第一的柯洁,不敌谷歌旗下围棋人工智能程序AlphaGo,收官阶段中以1/4子之差——即中国围棋里面最微小的胜负值落败。

这是继2016年3月AlphaGo以4:1总比分战胜围棋世界冠军、韩国职业九段选手李世乭之后,在慢棋规则中战胜的另一个围棋世界冠军。

自从1997年国际象棋冠军、有世界棋王之称的卡斯帕罗夫输给IBM的“深蓝”电脑之后,人们就将围棋视为人类智慧最后一块领地,有人说李世乭和柯洁的相继落败意味着在所有人类创造的智力游戏中人工智能都已经走在了人类前面。

落子乌镇

“黄梅时节家家雨,青草池塘处处蛙。有约不来过夜半,闲敲棋子落灯花。”国家体育总局棋牌运动管理中心主任、党委书记罗超毅以此诗句作为此次比赛的开场词。

今天的乌镇正飘着迷濛细雨,穿过长长的江南老街可以看到湿漉漉的石板路和烟雨迷蒙中的稻草屋,穿着雨衣的人们在田间劳作,一头黑色水牛站在雨地里发呆。

很难将这个画面和科技比赛关联到一起,但在开幕式上,主持人还是再次强调了这次比赛的重要性,“这是科技史上,围棋史上,甚至是人类发展史上十分重要的一场比赛。”

此次比赛从上午上午10:30开始,到下午2:55结束,共历时4小时25分钟,柯洁执黑子先行,AlphaGo执白,由DeepMind资深研究员黄士杰博士(AjaHuang)代为行棋,比赛期间双方都没有进食午餐。

现场提供了中、英、日三种语言直播,有来自全球的数百家媒体报道此次比赛。

在下至第12手前后,柯洁突然抓头笑了,这让现场点评的中国围棋协会秘书长华以刚和世界围棋女子冠军徐莹纷纷表示,“柯大侠在卖萌”,并引得现场观众哈哈大笑。

在对弈进行1小时左右,AlphaGo在棋局左上角的一个“断”子让柯洁大皱眉头,华以刚评论说,AlphaGo对子的效率的追求让人心烦,对弈结束后,这手棋可能成为本局对弈的争议之处。最终柯洁选择“脱先”,未曾理会白棋断子,而将下一黑子放在左下角。但徐莹认为,黑棋虽然不理会左上角的纠缠,但现在看左上角依旧“欠一颗子”。

在后续的新闻发布会上,常昊九段称AlphaGo的这步“断”给他留下了非常深刻的印象,欧洲围棋冠军樊辉也觉得这个断后,白棋变的“厚”了,原本很“厚”的黑棋看起来有一些漏洞。

收官阶段,在大幅占优的形势下AlphaGo落子速度依旧缓慢,“AlphaGo挺有意思,在不用想的时候,往往拼命想。”现场解说徐莹如此调侃。

赛后发布会上,柯洁如此回应自己比赛结束前的一个苦笑,“那个笑,就是苦笑,不是很开心的笑,我知道自己要输1/4子了……我觉得AlphaGo下得很精彩,但我自己也尽了全力,我觉得很多地方值得我们棋手去学习,探讨,它很多棋的思想,理念,在改变我们最初对围棋的看法,没有什么是不能下的。”

在这场对弈中柯洁输了1/4子,一度引发现场质疑,因为在中盘期,AlphaGo的优势十分明显,估算其赢了超过20目,对比最终的1/4子,有人认为AlphaGo有“放水”嫌疑。

在赛后的新闻发布会上有记者就此问题提问称,阿法狗是否可以控制输赢比例?

从某种角度看,这是一个有点儿可怕的猜测。

但哈萨比斯否认了这种说法,他认为AlphaGo只是一步步的增加自己赢得几率。

《财经天下》周刊记者在现场采访了英语流利说创始人,CEO,同时也是人工智能领域专家王翌,他解释说阿法狗不会像人类一样希望大幅赢棋,而是一步步将赢棋的概率提高到100%。在人们看来柯洁只是输了1/4但对于AlphaGo,它输得是100%。“这是1和0的区别。”他说。

这只是此次峰会中双方的第一局比赛,此次比赛采用三局两胜制,柯洁和AlphaGo将在接下来的5月25日和27日进行余下的两场比赛。柯洁在今天赛后说,“这是我和人工智能最后的三盘棋,现在只剩下两盘棋,能和AlphaGo对弈是我很大的荣幸,我会全力以赴,珍惜这个机会。”

除了柯洁和AlphaGo的对战之外,5月26日还将举行AlphaGo和人类棋手共同行棋的配对赛(AlphaGo分别搭档两个人类棋手古力和连笑进行对弈)和5位九段棋手对阵AlphaGo的团队赛(由芈昱廷、时越、唐韦星、周睿羊、陈耀烨五位棋手组队,联手向AlphaGo发起挑战)。

值得一提的是,去年AlphaGo对战韩国棋手李世乭,谷歌提供了100万美元的奖金,而今年该数字上升到150万美元(约合1033万人民币)。

AlphaGo的进化

此次和柯洁对阵的人工智能程序被称AlphaGo2.0版本,与去年3月对战李世乭的1.0版本相比,今天的AlphaGo已经有了更大的变化。

在1.0版本中,AlphaGo是“深度学习”人类棋谱,从而模仿人类下棋手法。AlphaGo之父、DeepMind创始人杰米斯.哈萨比斯(DemisHassabis)今年3月在母校英国剑桥大学题为“超越人类认知的极限”的演讲中提到,在开发AlphaGo时“我们从网上下载了成百万的业余围棋游戏,通过监督学习,我们让AlphaGo模拟人类下围棋的行为。”

▲柯洁九段和哈萨比斯以及埃里克·施密特合影

这意味着1.0版本的AlphaGo行棋风格依旧在人类棋手的经验和理解之中,随着算法的完善,AlphaGo会成为一个“接近完美的人类棋手”。

而现在2.0版本的AlphaGo则不再拘泥于人类棋谱,而是从对棋棋局中为下一代版本提供训练数据,以此循环往复,下出人类棋手从未尝试过的属于“人工智能”时代的围棋风格。

围棋一直以浩大的运算量著称,哈萨比斯在演讲中承认,围棋“一共有10的170次方种可能性,这个数字比整个宇宙中的原子数(10的80次方)都多,凭借当前的运算能力,是没有办法穷举出围棋所有的可能结果的。”

在此次围棋大赛前谷歌方面提供的信息中,他们称为了应对围棋的巨大复杂性,AlphaGo采用了新颖的机器学习技术,通过训练形成了策略网络(policynetwork),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布;然后再结合价值网络(valuenetwork)对自我对弈进行预测,而AlphaGo将这两种网络整合进基于概率的蒙特卡洛树搜索(MCTS)中,从而在下棋时获得优势。

这些变化为AlphaGo带来更“自由、开放”的行棋风格。

这个人工智能程序不再遵守人类几千年来的围棋经验,常常做出许多惊人的“神来之笔”。

哈萨比斯在演讲中举例称,在AlphaGo对战李世乭的第二局第37手中,它将棋子落在了右侧5路上。而在此前人们一直认为右方3、4路更重要,而AlphaGo的落子意味着“几千年里,人们低估了棋局中部区域的重要性。”

▲图左:第二局里,第37步,黑棋的落子位置图右:之前貌似陷入困境的两个棋子

类似的行棋风格在AlphaGo的自我对弈中更是随处可见,例如它会采用“右侧六子二路连爬”的方式行棋,但在古老的围棋谚语称:四路外势线,三路实地线,二路失败线。

人类棋手一直认为在二路做这种连爬是非常错误的决定,大多数棋手以二路连爬为耻,但从AlphaGo的后续行棋可以看出这种下法更有利于确保优势——人类相传数千年的棋谱经验在AlphaGo面前似乎不值一提。

金庸的武侠小说《天龙八部》曾有过一个著名的关于围棋的桥段,在对阵无崖子留下的珍珑棋局时,棋艺低劣的虚竹一反惯例,自填一眼,自杀了一片白棋,反而让局面开朗,并进一步破了这个残局。而今天AlphaGo展现出来的棋风和该桥段中的虚竹的落子类似,不同的是,虚竹是靠运气,而AlphaGo靠的是运算。

中国职业九段棋手,世界冠军时越评价说“AlphaGo去年对阵李世石九段的那几局棋,可以说整个颠覆了棋手们对于围棋的认知。AlphaGo所展现出来的实力大大超出我们的预期,并且给围棋带来了很多新的思路。”

而同是职业九段、世界冠军的周睿羊则表示“AlphaGo的对局让我们感受到围棋的自由性,没有任何一招棋是绝对不可能的。如今每一名棋手都在尝试新的风格,这在过去是不可想象的。”

这带来的直接改变是,AlphaGo可能衍生出更多新颖的围棋布局,正是由于人类和人工智能都无法“穷举”围棋的所有结果,所以大胆的尝试更可能走出意外的惊喜。

从某种角度看,围棋像是一个超级迷宫,人类和人工智能都不知道穿行其中的最优线路,但从当前的局势看,人工智能的寻路方式可能更高效。

柯洁的荣光与使命

实际上,在此之前AlphaGo已经和包括柯洁在内的多名围棋高手进行过较量。2016年末2017年初,AlphaGo在中国棋类网站弈城网和野狐网上以Master为注册帐号与中日韩数十位围棋高手进行30秒一步的快棋对决,连续60局无一败绩。包括棋圣聂卫平、古力等著名九段棋手都败于其手。

而在很多棋手看来,在快棋方面AlphaGo代表的人工智能程序有天然的运算优势,人类在30秒内的运算量无法和其匹敌,很容易陷入手忙脚乱的尴尬境地,从某种角度看,这对人类选手并不公平。

也正是这种争论促成了此次柯洁和AlphaGo的慢棋对决。这次比赛常规用时由2小时增加至双方各3小时。很多专业棋手认为,相对长一些的常规用时对人类棋手稍稍有利一些。

此次比赛由中国围棋协会、谷歌和浙江省体育局联合举办,比赛地址为乌镇互联网国际会展中心,此地也是世界互联网大会的主会场。选择乌镇作为比赛地,一方面因为其是世界互联网大会的永久会址;另一方面也和柯洁本人有关,柯洁是浙江丽水人,他个人更偏向于在自己的故乡进行该场较量。

生于1997年的柯洁今年只有19周岁,但他在围棋领域拥有优异的成绩。从2015年1月至2016年1月,柯洁一年内夺得第2届百灵杯世界围棋公开赛冠军、第20届三星杯世界围棋公开赛冠军、第2届梦百合杯世界围棋公开赛冠军,成为世界上最年轻的围棋三冠王。并且在2016年12月蝉联三星杯世界围棋公开赛冠军,成为中国首位蝉联同一项世界大赛冠军的围棋选手。

在根据全世界围棋职业大赛成绩计算而出的“GoRatings”排行榜中,截止2017年5月21日,柯洁以3620分位列第一名。

▲5月21日,柯洁在GoRatings网站的排名截图。

在AlphaGo出现的一年中,柯洁对其态度也发生了诸多变化。

去年3月9日,在得知AlphaGo对战李世乭胜利后,柯洁在微博上写道“就算阿法狗战胜了李世石,但它赢不了我。”

但在AlphaGo完成60连胜之后,柯洁改变了看法,他在新年寄语中表示,“人类几千年甚至没人沾到围棋真理的边”。

今年4月10日,也就是谷歌和中国围棋院联合发布此次对战新闻发布会的当天,柯洁在接受媒体采访时表示,“很幸运,能够生在这个时代,遇到AlphaGo这么强的棋手……与它对决时,明显感觉到它是来自未来的人。”并称无论AlphaGo有多强大,他也要去一决胜负。“我会抱有必胜的心态,和必死的信念。”他说。

昨晚11点15分,柯洁再次更新自己微博,发布名为《最后对决》的文章,称这是一个不眠之夜,并表示“决战前夕,感慨万千……无论输赢,这都将是我与人工智能最后的三盘对局……我相信未来是属于人工智能的。”

但和柯洁的决绝和对立不同,谷歌方面对此次比赛表达了合作共赢的看法。

Alphabet董事长埃里克.施密特(EricEmersonSchmidt)在开幕式现场表示“这并不是人机的对弈,最终应该是电脑帮助人类,电脑有他们的擅长之处。”

▲Alphabet董事长埃里克.施密特(EricEmersonSchmidt)

DeepMind创始人兼CEO戴密斯.哈萨比斯(DemisHassabis)表示,“AlphaGo就像哈勃望远镜一样可以帮助人类,不同的是后者探索的是空间宇宙,而AlphaGo探索的是围棋宇宙。”哈萨比斯在赛后发布会对此进一步阐述,“从我的角度说,我们希望AlphaGo成为围棋的工具,能够为人类所用……希望AlphaGo能够走入寻常百姓家。希望大家拭目以待。”

▲DeepMind创始人兼CEO戴密斯.哈萨比斯(DemisHassabis)

回顾下人类和人工智能在智力竞技中的历史——智力竞技的人工智能开发最早可以追溯到1952年的一篇博士论文。1997年,人工智能程序“深蓝”第一次战胜国际象棋冠军;2006年,人类最后一次打败顶尖的国际象棋人工智能程序。这中间有十年时间人工智能和人类智力不相上下。

如果,将这个过程套用到围棋领域——2016年3月,人工智能第一次战胜了世界围棋冠军,而一年之后柯洁首局失败。在国际象棋领域,人工智能用十年时间全面超越人类,而在围棋领域,这个时间有可能被大大缩短,人类的科技爆炸或可在这个数字中窥得一斑。