收到《陈祖德全谱》

早上进城出门时,收到了新出版的《陈祖德全谱》。
全集共三本,根据参与的棋谱录入数量,集数少了些,但棋谱通过矢量图输出,印刷质量尚好。
22年疫情结束最后几个月,正好封闭在家,时间空余,别接下了棋谱录入的活,友情相助,更是缘分。
没想到两年不到,居然有了成果。
在进城路上,跟小子交流,将来工作了,只要是工作,先接下来,没准做着做着,就成了。
这不是炫耀,也不值得,只是把他爷爷奶奶的话,总结再传下去而已。

古籍OCR录入

本次古籍点校工作时间过半,现在只剩下《围棋与棋话》的录入点校了。
最初接下这工作的时候,《围棋与史话》的工作量的评估是10万字,因为这是民国时期印刷体出版物,本以为以自己的打字速度还应付得了,便顺带接下来了。
但开始录入发现大意了。问题主要出在输入法上,现在的拼音输入法,在录入到一定字数后,他们自己对高频字开始犯糊涂,导致选字效率下降。
试用了几个OCR软件,价格高得离谱不说,效果很差。
最后决定使用OCR识别,最初没有选择OCR,是因为本书是繁体竖版,开始使用百度的通用文字识别,果然效果不佳,首先是识别文字是从左开始,且横竖混乱。
今天改为百度高清文字识别后,不止识别率提高,识别顺序也是先右后左,配合繁体转简体功能,效率大大提升。
还是只是传统识别,AI如果介入……,也就那样。

棋圣棋评,棋评棋圣

昨晚今早,在荷兰队打进乌龙球那一刻,终于把古籍整理的大部头24卷本文字录入完成了。
前两天录入中几乎崩溃,什么晚清让四子的水平还装模作样写棋评,通篇都是贬斥,那文字比流水账强不到哪里去,真的替毛笔手抄的作者不值,也为自己不值。
好在收尾的六篇《弈理指归续编》自拟谱棋评,调整了我的情绪,不止是因为终于完工解脱。
施襄夏作为棋圣,棋评写来如同其行棋一样如行云流水,虽为古文,“而”字的承接、转折运用自如,点校过程中几度想断句,最后还是放弃。
就像之前看完pandas书之后感慨的那样,优秀的人,做什么都是优秀的。

古谱棋评同样滑坡

周末集中时间,将古籍23卷对局部分的对局信息录入完成了。剩下的就是如入棋评了。
虽然如之前总结说,精华部分已经完成,剩下的棋评已经不多。但就是这些不多的棋评,我也是没有干劲了,真是够了。
这部分棋评主要是周小松的《餐菊斋棋评》和《皖游弈萃》,棋艺水平有限,不敢评论棋评内容,但是棋评的文字还是能分辨好坏高下的。显然周小松想模仿徐星友的《兼山堂弈谱》,但模仿无论是构思还是文笔,实在有效颦之感。
且这些棋评,多是评下不评上,贬多赞少,由此看周小松不敢评《当湖十局》,也就不奇怪了。
本来干的憋屈,偏偏电脑还死机了。偏偏忘了存盘,等了半小时,只得重启机器,还好损失不大。
看来机器真的要换了。

全面衰退的中国古代围棋

昨天突击,把古籍文献前八卷整理完毕,算是松了一口气。因为不止是进程完成三分之一,还因为棋评主要集中在这八卷中,可以说整个文献中最精华的部分已经完成。
剩下的工作相对要乏味多了,主要就是抄录棋局目录。上午抄了半卷后,才想到可以编一个程序来简化工作。
程序不复杂,抄录工作效率提升了一倍。整理完目录后,再对照目录进行剩余棋评的录入。剩下的棋评主要来自周小松,且不说对弈水平,至少文字水平,相比徐星友与程兰如,真是差了不止一个档次。
中国古代围棋真是全方位衰落。

点校随想:徐星友的地位

周末两天在家,时间宽裕,古籍点校进程出乎意料的快。重头戏第四卷点校完成后,第五卷文字录入也完成了。
与寄青霞馆系列打乱顺序不同,本次整理的古籍共24卷,是按照棋手汇总分卷。前两卷是眉山四杰对弈荟萃,第三卷为周懒予个人专辑,第四卷则是重中之重的黄龙士对局集。
昨天晚上熬了一会夜,把黄龙士对子部分76局完成了。进程顺利,主要是此前公众号整理过黄龙士全集,准备工作最为充分。
完成第四卷后,按照棋手的出生年月顺序,预计第五卷是徐星友的棋谱专辑。但意外的是,83局棋谱中,徐星友的棋谱只占了一半多一点,后面则是其后辈棋手的零散对局。
至于徐程十局,应该放在后面程兰如的对局集中。也许徐星友在作者心目中,是低于四大家中的程兰如、梁魏今的。

弈墨不入法眼

昨天整理古籍到第三卷,本卷的主角换作周懒予,称得上是周懒予的专辑。
棋谱主要来自《兼山堂弈谱》与《周懒予围棋谱》,后者的棋评中,不少是引用的《弈墨》。
对照之前整理的《弈墨》资料,发现虽然相比《弈悟》与《不古编》流水账般的棋评,《弈墨》的棋评已经称得上精炼,而本古籍的棋评抄录又进一步进行了简化。
这应该不是作者偷懒,否则《弈悟》的注水棋评更可以删减,这说明《弈墨》在清代的版本有多个。
另外一个大疑问就是,这个古籍中的棋谱大多数也被收录到寄青霞馆系列,而偏偏《弈墨》的棋谱一局也没有收录。
之前我认为这是寄青霞馆的编撰者看不上《弈墨》,看来猜测是对的。

古籍点校,难关已过

本次回家的一大工作,是想突击完成部分古籍文献的点校,因为原先购买的相关古籍书籍都在家里书架上。
开始整理了发现,原先那些书其实作用不大,主要是现在整理的大部头是手工毛笔抄写,清晰度非原先的刻本所能比拟。既然不存在字迹难以辨别问题,也就没有必要参考原先的刻本点校资料,谁对谁错还不一定呢。
晚上整理完24卷本的前两卷,最为艰巨的任务已经完成。这2卷中有《眉山墅隐》的全部60局,半数以上的《兼山堂弈谱》棋局,大部分的《不古编》流水账,后续工作难度与强度要小多了 。
第三卷,黄龙士要登场了。

读书人的颜面

最近没有更新自己的公众号,主要是因为忙于点校古谱。
原先在公众号号也发布了不少文章,但基本属于兴趣所致,随性而为,发了也就发了,错了也就错了。
而现在点校开始后,真的不敢再有马虎二字。这跟稿酬没有关系,算是读书人的一点颜面吧。
好歹算得上是读书人吧。
今天整理到《眉山墅隐》,回看对照原先的文章,真是汗颜。
希望完成本次工作后,能换一种方式更好整理古谱吧。

《血泪篇》开篇杂谈:katago的PDA调整

与《弈墨》不同,《血泪篇》中的对局属于让子棋,在使用AI犬分析前,我一直纠结是否要调整PDA。

PDA是katago配置文件选项playoutDoublingAdvantage的缩写,网上也被谐音称作“骗到啊”。通过设置PDA值,可以让AI犬知道自己比对手更强或更弱,并相应地进行下棋。通常设置为正值,最高为3.0,用作提高让子棋强度。

在初步分析《血泪篇》的时候,发现即便PDA设置为正值,在布局阶段效果并不明显。只有设为最大值情况下,白棋才会下出一些与实战胜率差距较大的着法,但实际意义并不大,因为三子优势本来就大,而已崭露头角的徐星友也非等闲之辈。

让我彻底放弃调整PDA念头的,是年后跟一位网友的让六子测试棋。那位网友前年曾经输给过katago,但当时的水平,katago在8万maxvisit设定下,已经让不动六子。在调整到PDA的最大值后,AI犬似乎也只是满足于少数几目而已,而不是追求胜利。

这应该就是好强争胜的人类,与无情绪化AI的区别。而这也是我赞同陈祖德先生《血泪篇》只是二人从“四子进至三子”阶段的正常对局而已。

同时,现代人在评论黄龙士让子棋技艺时,赞其“极擅让子”,“下让子棋时,却极少大砍大杀,弈得温文尔雅,却如同软刀子割肉,下手并未出什么大恶手,不知不觉中便已败落”。

这也正是《血泪篇》十局黄龙士棋艺的最好写照。

所以,在AI观古谱的《血泪篇》系列中,我放弃了对PDA的调整。