由农心杯决战看AI规则对胜负判断的差异

最近最为引人注目的就是农心杯的决战了。农心杯最后两局,都是半目胜负。因为在医院等候,都是通过腾讯围棋APP观看的。在评论区,有网友列示katago的胜率分析,与腾讯绝艺的胜率出入很大,甚至是完全相反的。

朴廷桓对柯洁的比赛最后小官子阶段,更是如此,双方都认为胜率超过99%,只不过绝艺是认为执白的柯洁胜局已定。解说的胡耀宇对此则抱有极大的怀疑态度,甚至因此遭到评论区的群嘲。

后来看到杨鼎新也加入评论,认为局势细微,甚至一度有些担心左下角的变化。好在最后黑棋收后,也就意味着双方目差是双数,既然细微,那就是白棋胜半目了。

最近购买了腾讯的GPU竞价服务器,显卡为Tesla V100,按量付费还算合算。安装好服务器后,运行katago调用棋谱文件,贴目设置为六目半。果然,直到对局结束,显示的都是黑棋胜率99%。

又使用自己的机器测试,无论是sabaki还是lizzie都是同样结果。

而用leelazero,结果则是完全相反。

因为农心杯使用韩国规则,贴目为六目半。根据以往的经验,本来采用自由贴目的katago更靠谱。但那主要限于布局和中盘形势判断,如果进入官子,尤其是小官子阶段,只是目数计算,所有AI应该是差不多的,katago出现这种错误的确不应该。

考虑到本局是黑棋收后,而katago配置文件中的对局规则是tromp-taylor,问题应该就是出在这里。

于是将对局规则改为Korean,再次调用棋谱,这次胜率显示正确了。

AI现在采用的规则基础普遍是中国规则的子空皆地。这主要是便于计算,但由于黑棋收后这个问题的存在,所以也就不得不接受中国贴三又四分之三子,也就是七目半明显不利于黑棋的的贴目。有些无奈,因为二者是相辅相成的,或者说是捆绑在一起的。

还算公道的重赛

今天等候本以为会不无聊,因为下午可以通过野狐围棋的APP看农心杯的直播。
但比赛开始后又变的无聊了,受疫情影响,习惯集体研究的中国棋手大部疲软,今天出战的范廷钰也不例外,着法凌乱,早早落后于跟AI更同步的朴廷桓。
就在朴廷桓胜率达到99%时,意外出现了:朴廷桓超时。
顿时网上热闹起来,一会规则,一会人格,一会国格。经过接近两个小时的协商,最后以不可抗力的原因,决定次日重赛。
朴廷桓在中国有个别名:朴填子。因为在亚运会的混双比赛中,在局势落后但时间领先的情况下,利用亚运会的用时包干制规则,在自己空中填子,意图使中国棋手时间耗尽而告负。
中国棋手在发现其用意后,提请裁判仲裁。东道主中国裁判判定其搅局,其代表团团长在观看棋局后,接受了判决认输,女棋手李瑟娥是哭着离开赛场。
那次比赛朴廷桓也许觉得冤枉,中国棋院设定的包干制,是建立在棋道上的规则,本身就是矛盾的。他是赢了规则输了棋道。
而本次超时,朴廷桓则是赢也规则,败也规则。赢的是竞技赛事规则,败的是经济比赛规则。二者都与棋道无关。
试想,如果现在大热的网络游戏竞技大赛,会因为赛手的硬件问题和网络状况而提请比赛结果仲裁吗?
自然不会,因为那本就是竞技运动的一部分。
而这,则不是围棋,即便是竞技围棋的一部分。
重赛也许是最好的裁定。

无知无畏观战感:Katago二子再屠龙

katago在6月22日发布了1.45版及最终权重,棋力大幅提升。因为室内温度较高,所以只是断断续续用40B进行了例行的十番棋测试,同上一版本及权重一样,对leelazero依然是压倒性的优势。
在第十局时,leelazero的274权重推出,前半盘二者选点重合度高了不少,不再像以前那样早早落了下风。但在双方接触的情况下依然不敏感,被katago通过攻击确定优势最终败落。
上一周,托中高考的福,天气凉爽了不少,于是又调用katago的20B权重与leelazero274权重进行了十番棋。结果出乎意料,katago一扫前两次1万playouts十番棋的疲态,同40B一样,实现了对leelazero的零封。
于是又动了测试让子棋的念头。40B权重让二子棋,pda按照0、1、1.5逐步提高,结果三连败,期中第三局是屠龙未果反被屠。将pad调整到2后,进行了最后一局,在后半盘的对杀中,leelazero再次出现漏算,大半盘棋子被杀。
而在leelazero败着弈出前,其形势判断就已经有些悲观,胜率计算要低于katago的判断值。这估计与leelazero的训练以固定贴目有关。
虽然分先katago拥有压倒性的优势,但考虑到贴目及让子情况,真正要让二子取胜,还是很难的。

https://mp.weixin.qq.com/s/ry7ezJ806LDoV5RmAtxYgg

无谓的妥协

在5月10日katago1.4.0版本推出的时候,曾经提到同步推出的权重“很可能是最后一个发布的‘semi-zero’神经网络,之后将使用外部数据”。
最近因为天气炎热,已经停止了AI犬的对战,对Katago和Leelazero的关注也就少了。今天从katago的GitHub主页上看到,几天前使用外部数据的新权重就已经发布了。
按照网站公布的信息,此次新权重使用了5%-10%的人类数据和其他外部数据。此外,新权重不出所料,针对芈氏飞刀也进行了专门的训练,但也提到由于定式的复杂性,这种训练并不是很完善。
看到有网友评论,说芈氏飞刀负责,我感觉那句话应该是针对定式而言,而不是专指芈氏飞刀定式。
不知是不是首次采用人类和其他外部数据的原因,作者认为新权重未必要强于此前最强的未使用外部数据的权重。甚至通过自比赛结果来看,新权重要弱于之前的权重,原因应该是花费了太多计算用于在机器自学习中不会出现的棋形( kinds of shapes that didn’t often come up in matches only against itself)。不知是否可以理解为,AI对很多人类的对局中棋形,原本是不予计算的。
如果说这种浪费是在不改变AI引擎的情况下,解决原先AI存在的一些非技术性问题,可以理解。但如果这种改变或者说牺牲,是为了提高与其他AI对战的胜率,那就实在是没有必要了。

AI笼罩下名局细解难出

昨天是LG杯八分之一决赛,中韩两国排名第一的柯洁与申真谞狭路相逢。在闷热的小屋里面开着lizzie+katago同时,观看野狐网站胡耀宇讲解对局。
申真谞今年状态火热,上一局淘汰中国范蕴若的比赛中简直像是开了AI外挂。本局比赛亦是如此,柯洁则表现略差,早早落后。但就在直播解说胡耀宇也认为逃不出的地方,却被柯洁用来当做劫材库,终于等来了申真谞的败招,一举翻盘。
看完直播之后,今天一直在期待胡耀宇的讲解。但直到晚上10点半也没有等到他公众号的更新。的确,这局棋实在复杂,尤其有了AI后,要将对局细解写好,还不能绕开AI,实在有些难了。
katago表现优异,无论是申真谞的妙手75,还7是后期的翻盘。因为可以设定贴目,某些情况下形势判断甚至要好于固定在7目半的野狐直播AI绝艺。

久违的国际赛事

今天LG杯中韩网络开战,也算是久违的国际赛事了。

重点关注的还是唐韦星对金志锡的比赛。一边开着新浪,一边开着lizzie手工录入。

本来还挺心疼自己的机器,后来发现没有必要等到风扇呼啸,基本在5000playouts之内就能算出胜率较高的几手棋,这时候按一下空格键就可以暂停分析了。
两倍于原先观赛用矿卡的1660显卡,性能的确提高了不少,在最后对杀阶段基本已经可以秒算,难怪网上那么多人开口闭口非2060显卡不谈。

但样高性能的显卡,应该只有职业选手分析学习可用,至于爱好者,使用砸钱堆硬件,似乎就跟当年美苏两国,卯着劲囤积可以毁灭人类几遍的核弹差不多吧。

不一样的安永一

最早知道安永一,是通过陈祖德的《超越自我》。出访日本,作者眼中拿起桃子擦一擦就吃的安永一,无论是衣着还是行为,都是日本那个讲究礼仪风度时代的另类人物。
安永一更为人知,或者说更为昔日围棋爱好者所知的,是吴清源、木谷实引领新布局运动一书《围棋革命——新布局法》的执笔人。安永一后来著文提到,新布局革命,不是布局技术革命,是打破旧的棋阀制度基础上的思想革命。
在《日本围棋历代名手名局史话》书中,安永一通过野泽竹朝的棋评,表达了自己对旧棋阀制度封闭独断的不满,对道策等名手名局也是嘀嘀咕咕。
按说这样的安永一应该是不拘等级的。但在坂田荣男的回忆录中,当小时候的坂田对长辈的棋洋洋得意指手画脚的时候,被胡子气得像张飞一般的安永一一巴掌闪到一边了。
而对同是少年,安永一发现天生赌徒的藤泽秀行,在旅行中赢了同伴的钱后,只是斥责一句“还给人家”就了事了。
看来,只能用坂田小时候实在不讨人喜欢来解释了。

围棋书籍日文翻译佳作

昨天因打谱想到了书籍的外文翻译。今天在伟东整理书架的时候,将不同版本的书籍清理了一下。可能出于怀旧心理,对几本非人民文学出版社的世界名著,总有一种鸡肋的排斥感。这些书虽然非那些论斤卖的书能比,但是总少了一些厚重感。
在飞扬论坛,看到一位网友在回复一篇同样涉及到翻译的帖子时,提到国内翻译界的问题,说上世纪八十年代,英文书的翻译费是每字八十元左右,一本书翻译下来,可以买一套四合院,所以翻译一本书需要几年时间用心揣摩;而现在好像还是千字百元左右,一本书一两个月就翻译完,所以难出精品。
不知道这位网友所说是否属实,但现在书籍的翻译水平下降是不争的事实。
我读过日本围棋书最好的,是华以刚翻译的《围棋实战研究》。专业人士译专业书籍,又有文字功底,完全可以当日本围棋全盛期的史书来看。
另一本书是安永一的《日本围棋历代名手名局史话》,这本书则可以作为日本史书来看了。
本书的译者不太熟悉,但出自八十年代的人民体育出版社,也保持了高水平。翻译流畅的同时,也将原作者的情感通过文字流露出来,尤其是关于英年早逝小岸壮二的回忆。
小岸壮二属于长考派,一局棋能下一周,而那时对局费是每局五日元,按安永一的话:一周下一盘棋非饿死不可。
如《漫长的告别》里所说:大规模生产无品质可言。

日文围棋书的翻译

进入夏天,围棋AI是在显卡风扇的呼啸声中运行的,且不说心疼那DIY史上最贵的配件,那噪音也没法静下心来观战。

于是又把棋盘棋子搬出来,继续打许久未打的本因坊秀策全集。

打谱的感觉并不好,一是很久没有摸棋子寻手数了,再者打的那局是一局联棋。

我对围棋的联棋颇为抵触,感觉那根本不是围棋,而是一种活动,以围棋媚俗的商业活动。

吴清源曾说围棋的最高境界是和谐。以我的水平是无法理解,但围棋之美,美在和谐的观点,我是赞同的。

而这种和谐美,在围棋上的一个体现就是构思的巧妙,运行的流畅。而多人进行的联棋,是无法实现的。

我打的那局,即便是由当时坊门外的高手进行的联棋,也最终是棋手间的棋风不同,导致构思失算而落败。局后太田雄藏难掩气愤之情,这局内局外都难言和谐。

我曾经动过学习日文的念头,就是想能大概了解日本的围棋书籍,后来发现,虽然日文中有大量汉字,但翻译讲究信达雅,意思绝不能按照字面理解的。太田雄藏的局后言语翻译就是一个例子。

原文按照本书李昂的翻译,是:我等富有深意之构思,算知竟不能知,故而致败,算知与盲人无异。而在另一本《日本围棋三棋圣》中,后面则翻译为:我队所采取的战略,算知不配合,怎能下得过,算知是瞎子。

虽说原日文已经记不清了,但仅看用词。这翻译水平高下立见,也决定了书的档次。

Katago二子屠龙

本因坊秀策短暂一生中最骄人的战绩,是代表坊门在十三年间的御城棋战中的十九连胜。

显然秀策也非常在意自己的连胜纪录,在连胜后期,安井门的新继承者安井算英曾通过本因坊秀和,有意与秀策下授二子棋,但被秀策婉言谢绝。算英一直引以为憾。

当时算英只有15岁,但秀策认为二子棋,黑棋如果弈出好棋,他根本没有办法,分先或者让先的棋份,他则不怕任何人。

此间虽有爱惜羽毛的成分,但也可见围棋二子威力何其大。

在Katago1.4.2的40B权重连胜之后,就动了测试一下让子棋的念头。

对局条件playouts依然设定1万,按照中国传统让子规则,黑棋贴2目。

开始两局,并未调整PDA,白棋毫无机会地败了。第三局将PDA调整到1,依然败北,而且败的可谓是“波澜不惊”。

这就有些不符合Katago的脾气了,查看用时,感觉怎么这么少,再查看权重文件,才发现因为刚与leelazero进行了20B的第二次十番棋,忘了把权重调回来了。

调整好权重,Katago果然大显神威,二子棋屠龙leelazero。

前一百手胜率非常平稳,但根据以往对Katago的了解,棋肯定不会放过中腹那八颗黑子,而胜负关键就在这里。

105手安顿好下面白棋后,Katago自认胜率超过20%,即便是对子贴目棋,这也是可战的胜率了。

115手开始动手后,胜率超过30%,这已经算是有望的局面。

148手后Katago自认胜率超过50%,终于领先了。

但随后的两局,leelazero没有再给Katago发力的机会,平稳获胜。

二子的威力果然巨大,在1万po条件下,如果不导入到Katago擅长的战斗局面,很难取胜,而以leelazero的水平,不需要如秀策所说,弈出好棋,只需要不犯错,Katago也很难越过这二子鸿沟。

此番让子棋是在机器显卡风扇呼啸声中进行的,夏天已至,AI犬的测试只能暂告一段落了。

对弈平台:

katago:1.4.2OpenCl +g170-b40c256x2-s370权重

leelazero:272权重

MaxPlayouts:10000

PDA:1.0