AlphaGO与棋和路

文章来源：企鹅号 - 象棋残局

最近几年，人工智能领域，棋类领域最热门的就是这款棋类程序——阿尔法狗。

一，阿尔法狗和棋

2016年3月，阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战，以4比1的总比分获胜；2017年初，该程序在中国棋类网站上以“大师”（Master）为注册帐号与中日韩数十位围棋高手进行快棋对决，连续60局无一败绩；2017年5月，在中国乌镇围棋峰会上，它与排名世界第一的世界围棋冠军柯洁对战，以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过

人类职业围棋顶尖水平。2017年12 月7日，阿尔法狗的升级版——阿尔法零，通过自我对弈强化学习，约2小时击败日本将棋顶级人工智能程序，4小时击败国际象棋顶级人工智能程序，8小时击败战胜韩国棋手李世石的“阿尔法狗”。

在2018年的“碧桂园杯”象棋赛上，还推出了一个“索菲亚”，“”索菲亚”之行据说还对象棋提出了质疑：“下象棋只是运算推演的过程。AlphaGO打败人类，足以说明人类没必要再继续学习、研究棋路。” 虽然我们清楚这只不过人类自身的疑问，只不过借以索菲亚之口的炒作，意在引起更多人的关注，但是，我们不得不承认索菲亚之言不无道理。

早在1997年5月11日，超级计算机“深蓝” 战胜国际象棋世界冠军的时候，就已经震惊世界，惊呼“人类尊严不再”。当时，围棋界还在窃喜，认为计算机下围棋想战胜人类还需要100年以上，短短的二十年，人工智能让人们刮目相看。这不，索菲亚言语里已经有啦嘲笑的味道！

嘲笑也不得不听，现实就在我们面前。中国象棋虽然没有与阿尔法狗沾过边，但是早在2006年国内的象棋程序“天梭”的水平早已在所有顶级大师之上，自从那以后，棋软与大师们很少在接触，因为已经再无悬念。

问题在究竟哪里？如今我们要在我们制造的机器面前感到脸红？有难么多人在惊呼“人类智慧的最后堡垒被攻破”、“象棋发展的根基遭到撼动”……这到底是什么原因？

也有一部分人认为，人和人工智能下棋，就像人与汽车赛跑人输了是再自然不过的事情，没是你吗大惊小怪、没什么可惊呼慨叹的。这种认识表面上不无有道理，过去本人也经常用这个比喻，但是细想起来并非如此。

其一，人与汽车赛跑，汽车是人控制的，即便自动驾驶也是人设计的程序支配，还是相当于与人赛跑，只是双方并不在一个平台，显失公平而已。其二，这是很重要的以方面，人们容易忽视，造成认识的偏差。这就是，汽车跑需要的必要条件——路。没有合适的路，汽车寸步难行，这是不公平的另一个重要方面。

二、路

“世界上本没有路，走的人多了便成了路”！可见，路不是自然的，我们人类所处的环境本来没有路，是我们人类的创造。也就是说，路的形成过程早已经体现出人类的智慧。你看我们为了让汽车跑起来，逢山钻洞，遇水架桥，路要比汽车宽，比汽车长，还有尽量平整不刮底盘……大量的辛劳。修好了路，在想方设法给它加上强劲动力，然后我们和汽车玩赛跑，我们一败涂地后，又震惊、又慨叹、还悲哀……一切的不高兴都来了。我们不是自虐是在干什么吗？汽车赢了我们吗？不是，它的一切都是我们给的，是我们战胜了自然。其实保持它的动力（虽然也是人给的），只要一起“回到自然”的环境中，汽车不一定比过人的腿。在自然环境下，我们随便找个沟坎，汽车就完蛋。

因为，它虽然有动力，但是，如果没有合适的路，寸步难行。

恰巧，围棋19路，象棋9路。和汽车同样的“路”，本身在原始意义上应该没有多少区别，现实中也是如此，二者都是我们人类已经修好的路。一块棋盘加上行走的规则，就形成了完整的路线，计算机就好比有强劲动力的汽车，人和计算机下棋，就像在修好的路上与汽车赛跑，就是自虐。

我们能不自虐吗？当然能！上面所说的“回到自然”玩比赛就是一个方法。汽车战胜我们原因之一是以为我们修好了路，给它解决掉了前进路上的所有危险，战胜它要回归自然。那么，下棋如何可以回归自然而使我们不自虐呢？

象棋等一般棋类都属于“完全信息博弈”，对弈中的所有信息都可知的，什么地方可以走、什么地方不可以走都是可以看得出的，实质上就是早已经修好的路。现在还有人探讨“为什么棋谱不给版权”？不给的原因就在于：“棋谱的走法是固有的，是发现不是创作”。简单的讲，电视上正在转播的一盘棋，说不定古人已经下了无数次，也说不定在哪个穷乡僻壤之地两个老翁、两个小孩也正在下同样的棋。

完全信息的环境并不是人类生存的环境，我们的自然界存在着太多的未知、太多危险、太多新奇、太多的奥秘……我们人类的大脑始终在这个又有已知又有未知、既有确定又有不确定信息的环境中进化成长,假如只能应对确定信息，人类早已经灭绝了，因为那相当于应对不了环境的变化。所以，“完全信息博弈”人类只能部分发挥自己的智慧。还用路来做比喻，只有规定好合适的路况，汽车才可以和人比赛。同样，只有定好了棋盘和规则，人工智能才可以和我们人

类下棋。

我们与自己研究的机器下棋，还要不被虐，怎么办？回到自然环境，回到我们人类智慧生长的环境，这就是“不完全信息”环境，来到“不完全信息博弈”。“不完全信息博弈”，对弈过程存在着诸多的“不可知” ，“路”具有不确定性，对于我们人来讲分析判断以及决策不成问题。但是，对于人工程序来讲会有一定困难，因为同一局面有多种认识，而且会以为棋手、环境、舆论等等的变化而变化，程序本身不能提前设定，假如运用概率解决提前设定的问题的话，又出现“何时运用的问题”，程序可能会乱下。“不完全信息博弈”不只是信息是否完全的问题，还有个“时机问题”，随着环境、时间的变化总在变，刚才确定，一会儿又否定，刚才认为是真，随后认为是假。一个棋手一个感觉、一个棋局一个想法。

三象棋发展之路

象棋就像一种乐器，美妙的乐曲要靠乐器的丰富表现力。如今，象棋发展中那么多的不如意，我们不能把注意力全部放在和棋问题、关注度下降、爱好者群体老化上····，要想一想象棋本身。就像乐曲的不动听，不能只盯着作曲、演奏上也要想想乐器的问题一样。

任何的文化，任何的艺术都是必须有它的“载体” ，没有这个载体人类任何美好的设想、任何美好的情感只能停留在人的大脑之中。这个载体就是这个文化的“质” ，文化的“量”由这个“质”的出现而产生。象棋本身是象棋文化发展的“质”的所在，而我们古往今来的任何关于象棋的人物、事件、古籍、研究成果以及所有的社会活动，都这象棋文化的“量”的表现。

我们为什么要确认象棋文化的“质”与“量”？因为我们只有知道这些才能认识象棋文化的发展规律，只有明了它的发展规律，我们才可以找到正确的象棋发展之路。

任何事物的发展，都遵循着“质量互变规律”，象棋文化的发展也理应如此。象棋定型于北宋，距今已经有千年的历史，就是说象棋已经千年不动了，这个“质”已经稳定了上千年。那么是不是长时期的稳定就必须“动”呢？当然不是，要看了“量”的发展情况。这就像人两条腿走路，只有稳住一条腿另一条才能迈进，假如迈进的一条腿有了足够的步幅，稳住的一条才到了迈进的时候，不然就会跌倒或原地打转。从发展的角度看，象棋文化的“质”与“量”状况非常清晰，

一个千年未动，一个积累千年。从现实的角度看，就是原地打转的状况。我们有理由相信，如今应该是“质”变得时候。

象棋发展之路已经走到了一个发生质变的历史时期，这是事物发展的规律，这应该是一种正确的认识。

四，探索之路——奇袭象棋

奇袭象棋实际上已经有了30多年，奇袭象棋的最大特点就是对象棋有“全面的继承”和“开创象棋的不完全信息博弈”。它可以生成100种不同的暗面布局，超象棋5300万倍的变化，防棋软外挂，贴切运用兵法，会象棋的人，一分钟学会'。希望关心象棋文化发展的人士多加关注。

发表于: 2024-02-232024-02-23 06:18:33
原文链接：https://page.om.qq.com/page/OjVAseZtNLyvuxDO3jInK0Jw0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

AlphaGO与棋和路

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐