首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

给腾讯鼓鼓掌!企鹅家的AI围棋软件“绝艺”让两子战胜柯洁!

不只AlphaGo超强中国棋王柯洁让两子还是败给腾讯AI「绝艺」

【科幻直通车】请关注本企鹅号,好玩的科学科技科幻消息随时从外星直接发过来!

与柯洁对弈的是腾讯AI Lab 研发的围棋AI「绝艺」(绝艺指导A)。但是很快,尽管被让二子,柯洁仍在第77 手或许是对自己的表现太过不满而直接认输。这场意义重大的对决,就这样猝然终结。

1月18日,腾讯AI Lab研发的围棋人工智能程序“绝艺”最强公开版本(即“绝艺”挑战赛版)于17日晚间首次在野狐围棋与柯洁九段和连笑九段的对弈中获胜,这是围棋AI在让子棋中首次战胜了最顶级职业棋手,进一步体现了人类持续探索围棋边界的精神,及腾讯不断进取的AI研发能力。

17日晚八点半,柯洁九段对战“绝艺”,成为首位受让二子(黑贴6目半)与AI对弈的世界冠军。本局仅弈77手,柯洁追杀白棋右上未果,爽快认输。一个小时后连笑九段跟进,鏖战247手后中盘告负。

“绝艺”是腾讯AI Lab于2016年初开始研发的围棋人工智能程序,2017年相继在“UEC杯”和“AI龙星战”等世界计算机围棋大赛上斩获冠军。在2017年11月,“绝艺”在腾讯围棋对顶尖职业棋手取得59连胜,并让二子战胜“绝艺”UEC版,以60连胜完成版本升级。2017年12月,在三亚举办的“绝艺挑战赛”上,绝艺战胜腾讯围棋锦标赛的冠军童梦成六段和亚军连笑九段。2018年1月9日,“绝艺”开始让二子对决职业棋手的行程。

17 日晚八点半,在腾讯野狐围棋平台的1059 号对弈房,迅速聚集了7000 多名围观棋友。如此火爆,只因这里正发生着一场围棋史上极为罕见的对弈——作为国际围棋界职业顶尖棋手,而且是最顶尖的那个,柯洁首次在公开对战中成为被让子的一方,而且是让二子(黑帖6 目半)。

与柯洁对弈的是腾讯AI Lab 研发的围棋AI「绝艺」(绝艺指导A)。但是很快,尽管被让二子,柯洁仍在第77 手或许是对自己的表现太过不满而直接认输。这场意义重大的对决,就这样猝然终结。

随后,超级银冠棋手剑过无声(连笑九段)登场挑战「绝艺」,但苦战247 手后仍然无奈认输。

「绝艺」对弈柯洁九段(即「潜伏」)和连笑九段(即「剑过无声」)。对弈中,柯洁追杀白棋右上未果,仅弈77 手,便爽快认输;一个小时后连笑九段跟进,鏖战247 手后中盘告负

围棋界的人士可能对「绝艺」的大名已经耳熟能详了;而非围棋界的人士,可能还不是很了解此「中国狗」。

相比于日本的DeepZenGo 和英国的AlphaGo,中国在Computer Go(电脑围棋)的投入起步较晚。腾讯公司从2016 年2 月才开始着手研制围棋AI。但很快,「绝艺」人工智慧的第一个版本便于2016 年3 月4 日完成了。

随后,「绝艺AI」在腾讯围棋的野狐平台上开设了多个账号,包括虎虎有生气、野狐扫地僧、天下无狗20、绝艺、骊龙、刑天等。其中「绝艺」账号使用时间最久,对弈盘数最多,名气也最大。目前在野狐平台上有「绝艺指导」A、B、C、D 等各个小号,分别用于对弈不同段位的棋手。

此次与柯洁等职业棋手对弈的“绝艺”挑战赛版,参考了2017年10月公开的AlphaGo Zero论文,并在实践中做出了改进。这个版本使用了40 block dual-resnet模型,以老版本的绝艺为基础进行强化学习,自对弈了数百万棋局,在有限的资源和时间内,通过把强化学习和监督学习相结合来加速训练,快速提升了棋力。

“绝艺”是腾讯推进前沿科技赋能国粹文化的代表。让子棋是人类通过AI不断探索围棋边界的范例。AI的每一次进步,都是人类智慧的进步。回顾“绝艺”从研发到成长过程中,始终与柯洁、古力等世界棋坛高手密切交流与切磋,还开发了指导棋、棋赛讲解等功能,不仅帮助提升棋力,也深受广大棋迷喜爱和关注。

未来,腾讯将继续加大对围棋AI的研究与投入,打造世界级围棋AI能力与推广,更在AI上推进深度学习等前沿AI科技的研究与应用。

「绝艺」艺名来源:

重送绝句(杜牧)

绝艺如君天下少,闲人似我世间无。

别后竹窗风雪夜,一灯明暗覆吴图。

虽然起步晚,但是绝艺AI 发展却很快。仅仅经过4 个月的时间,在2016 年6 月下旬,绝艺已经突破了业余6 段;同年8 月便开始在腾讯旗下的野狐围棋网路对弈平台测试,8 月23 日首次战胜职业棋手,11 月2 日第一次战胜世界冠军江维杰,11 月19 日首次交手柯洁取胜。

绝艺第一次大范围引起关注,是2017 年3 月初在野狐平台上晋升为「十段」高手。但实际上在此之前,它已经战胜了包括韩国围棋国手古力、连笑、朴廷桓等高手;甚至在2 月14 日至2 月24 日期间,和柯洁交手十次,无一败绩。

随后,绝艺在2017 年3 月18-19 日的第10 届UEC 杯世界电脑围棋大会上战胜了当时电脑围棋界的「第二」AI——DeepZenGo,夺得冠军。由于这次夺冠,绝艺获得了参加第5 届电圣战的资格,在2017 年3 月26 日对弈来自日本棋院的新锐棋手一力辽,并执黑157 手中盘胜。

事情总是无挫不勇。2017 年8 月在鄂尔多斯举办的中国围棋大会首届世界智能围棋公开赛上,「绝艺」半决赛对弈DeepZenGo 不幸落败,未能进入决赛。此役之后,「绝艺」卧薪尝胆,不断迭代。

2017 年11 月15 日野狐平台上出现了一个昵称为「符合预期」的账号,数日内鏖战99 局,除了第40 局被柯洁击败外,余者全胜。同时「符合预期」还对战了绝艺指导A(UEC 杯夺冠版),在让二子的情况下,以60 连胜完成版本升级。

12 月10 日在日本秋叶原举办的2017 围棋龙星战(AI RYUSEI)决赛中,升级版「绝艺」相继以平稳的表现战胜MayoiGo、Raynz 和AQ,并在决赛中再会老对手DeepZenGo 并轻松获胜。知名棋手剑过无声(连笑)甚至评论说「绝艺可让Zen 两子」。

进入2018 年后,从本月9 日开始,装备了最强公开版本的「绝艺」(野狐平台账号为「绝艺指导A」),开始了让二子(黑帖6 目半)对决职业棋手的行程。截止到与柯洁对弈前,事实上「绝艺」已经与职业棋手对弈了31 局27 胜4 负。与柯洁和连笑的两场让二子对弈更是让这轮对决的意义推上了巅峰。

围棋AI 对弈中让二子的问题腾讯AI Lab 做了以下回应:

包括AlphaGo 在内的围棋AI 都存在赢棋退让的问题,原因是AI 以赢棋为目标,胜率过高时下哪里都赢,不一定会选择赢最多的下法。

而让子棋就是另外一种胜率过低的极端情况,以绝艺海南挑战赛版本为例,这是一个分先版本的AI,如果要求其以让2 子开始对局,则初始胜率为7%(让3 子则初始胜率1%,让4 子则初始胜率0.1%)。并且实力越强的版本,下让子棋时的初始胜率就越低(因为AI 下棋时会假设对手跟自己一样)。

初始胜率过低将导致AI 不能发挥出真正的实力,这也是现在绝艺让2 子还不能全胜的原因。我们最近在尝试优化演算法,来解决胜率过低带来的负面影响,争取以后在让子棋里有更好的表现。

据腾讯AI Lab 的公开新闻介绍,此次与柯洁等职业棋手对弈的「绝艺」挑战赛版,参考了2017 年10 月公开的AlphaGo Zero 论文,并在实践中做出了改进;使用了40 block dual-resnet 模型,以老版本的「绝艺」为基础进行强化学习,自对弈了数百万棋局,在有限的资源和时间内,通过把强化学习和监督学习相结合来加速训练,快速提升了棋力。

为了了解「绝艺」如此迅猛发展背后的技术细节,特地采访了「绝艺」团队的成员。

问:这次「绝艺」在与柯洁、连笑等职业选手的对弈中,均取得不错的成绩。请问柯洁等职业棋手是否参与了「绝艺」的开发?在「绝艺」的成长中他们起到了什么样作用?

答:柯洁没有参与绝艺的开发,但是柯洁等几十位职业棋手可以使用绝艺内测网站,「绝艺」也在腾讯野狐围棋上与棋手对弈,所以很多棋手共同见证了整个「绝艺」的成长过程。

罗洗河九段是绝艺的技术顾问,给绝艺团队围棋技术方面的指导。

问:通过您们的新闻了解到,这个版本的绝艺技术上主要参考了2017 年10 月份deepmind 发表的关于AlphaGo Zero 的文章。您们对这篇文章的内容怎么评价?在具体实践中,您们做了哪些方面的改进?

答:AlphaGo Zero 是非常让人震撼的研究成果,除了让围棋水平达到一个新的高度,它还不依赖人类知识,让zero 的演算法具备更高的推广价值。

绝艺学习了Zero 的dual-resnet 模型,和绝艺老版本相比有更高效的强化学习演算法。因为绝艺还在不断参加比赛进行锻炼,比如2017 年12 月腾讯棋牌的「绝艺挑战赛」等,所以我们没有选择从「零」开始,而是以绝艺老版本为基础进行强化学习。这样可以大幅减少训练时间,在有限的资源和时间内完成。目前我们已经在开发从零开始的版本了。

问:相比11 月底的「符合预期」以及12 月中旬的「绝艺」,挑战赛版的「绝艺」有哪些方面的改进?开发这个版本的「绝艺」花费了多少时间?

答:绝艺近期公开亮相的三个版本之间的主要差异:

2017 年11 月符合预期:20 block dual-resnet,自对弈了数十万棋局

2017 年12 月日本AI 龙星战:20 block dual-resnet,自对弈了数百万棋局

2017 年12 月三亚绝艺挑战赛:40 block dual-resnet,自对弈了数百万棋局

从10 月下旬开始,用了1 个多月时间完成了上述三个版本的开发。

问:「绝艺」在多个比赛中战胜了国际上一些历史悠久的电脑围棋,请问与DeepZenGo 等电脑围棋相比,「绝艺」有哪些方面的优势和不足?(例如技术、理念、团队等)

答: 我们很难简单把「绝艺」和其他围棋AI 进行比较,如果回顾「绝艺」从研发到成长过程中,始终与柯洁、古力和腾讯围棋上的职业和业余棋手密切交流与切磋。

问:「绝艺」团队已经在「绝艺」的研发上做了很久的工作,请问您们对「绝艺」的定位是什么?现在绝艺已经达到能够让二子与人类的职业选手进行比赛了。再开发下去的意义在哪?

答:我们认为在研究、应用和社会价值上,「绝艺」都有其特定意义。

围棋AI 研究由来已久,相关的演算法也不断推陈出新。「绝艺」涵盖了人工智慧最热门的研究领域——深度学习和强化学习,我们在不断研发中受益良多。

从应用价值上,腾讯野狐围棋是中国最大、最活跃的的围棋平台之一,「绝艺」目前已经有还开发了指导棋、棋赛讲解等功能,也深受广大棋迷喜爱和关注。

而在社会意义上,我们看到AI 的每一次进步,不仅挖掘围棋的潜力与边界,也在展现着人类的智慧与进步。这也是AI Lab 对于绝艺的期待——希望它能与人类棋手积极互动,从而激发更多关注并传承围棋这一中国传统文化。这是我们的一种科技责任感。

问:在去年三月份UEC 世界杯大赛中的绝艺总体框架遵循的是AlphaGo 在2017 年1 月份发表的文章;而这次则主要依据2017 年10 月份AlphaGo Zero 的文章。现在Deepmind 已经不再继续开发AlphaGo 了。所以您们打算以后如何进一步开发绝艺的性能呢?

答:绝艺会一直坚持开发下去,除了不断提高棋力,我们也会研究解决一些有趣的问题,比如现在的AI 以获胜为目标,胜率过高时可能会退让,不一定会选择最优的下法。

腾讯将继续加大对AI 的研究与投入,打造世界级围棋AI 能力与推广,更在AI 上推进深度学习等前沿AI 科技的研究与应用。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180122A032FU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com