用心难以二用

使用文字识别功能处理古籍校对后,相比较键盘录入,效率可谓翻倍。虽然机器识别仍有错误,但也在所难免,且对识别结果的核对,也省却了后期的校对环节。
只是效率提高,工作量或者说相应增加。原先处理古籍的时候,还能打开央视网站小窗,自谓两不误。
现在,是忙校对的时候,不用说是画面,连声音都听不进去了,而如果看看关心的片段,那校对工作就必须停下来。
还真没有一心二用之说,如果有,那也不是真正用心。

百度文字识别性能不错

昨晚又测试了一下百度文字识别,对竖版繁体古籍的识别情况。民国时期的出版物,一般在文字中人名、著作名等旁边有竖线,或者波浪线,以进行标识。
识别结果令人满意,那些额外的标识线并没有产生影响。
原先百度的文字识别功能中,普通版与高清版的免费使用额度不同,高清版要少于普通版。现在普通版的额度降低到与高清版持平,但从二者识别结果看,高清版不止是提高了识别精度,还能根据文档的排版情况,自动区分是竖版还是横版,左先还是右先。由此看高清版是全方位的升级版,降低至普通版免费额度后,估计将会完全替代普通版。
而下一步的升级,应该是根据上下文的文字调整了,现在看,还没有这个功能。

文字识别初比较

本次古籍的文档识别,是用的百度提供的高清识别服务,每个月有1千次的免费限额。正常使用,完成本次工作也足够了。
预防起见,再者也想做一个备案,于是又测试了一下腾讯云提供的同功能服务。
测试结果差距不大,但过程中发现,同是通过API提供服务,无论是API代码,还是技术文档,腾讯相比百度,二者水平差距差了近一个档次。
这应该是跟进入领域先后无关,想必只是在钱途不明的情况下,后来者用心不足罢了。

山西醋 王村醋

昨天儿子暑假实习的地方定下来了,去大同。然后晚上就看到抖音上上高架桥观海的视频。
去年房山区,今年大同,不由感慨:怎么要到哪,哪里就淹啊。
相比周口店,大同可是好地方,那是山西地界,产醋啊。
儿子信心还是不足,觉得是小地方未必有好醋。
其实醋这东西吧,好坏不看地方,不看厂家,看工艺和品质。
很多年前,淄博进口最有名的,也最拿得出手,是王村醋,到了王村马路两边都是成捆的醋,开始质量是真不错,后来是越做越烂,跟刷锅水差不多了。
再后来川鹰牌也曾经想重整旗鼓,最后也只是昙花一现。
希望儿子到大同能买到满意的醋吧。

高考成绩公布三年记

今天山东公布高考成绩,本想上去看个热闹,孰料网页居然打不开。这还是五年多来,第一次遇到这种情况。
这也难怪,据说21年的考生人数记录,今年被打破了。
下午在公交车上,跟儿子一起复盘了一下这三年的录取情况,感觉他那年真是所有计划好的路,从军校体检开始,就都被堵死了,或者说不叫堵死,是加了警示牌:此路不通,请走旁路。
最后临到站前,儿子也坦然承认:这就是命。

刷学渣不刷人渣

这几天刷视频,复旦打老师的短视频不少,今天看那学生的潜在下家已经跟他切割了。
春节期间跟媳妇聊天的时候,学到一个新词,叫刷学渣不刷人渣。
不管高考还是考研,只要是考分制,刷学渣同时自然也能顺带刷几个人渣的。但要是申请制,可就不好说了。
估计打人的不知道这个词,现在可能跟小品《主角与配角》里的叛徒一样:我要是再咬咬牙……不就挺过来了嘛!
咬咬牙,忍一忍,三年后我就可以打北大的老师了,那不更有面!

夏至进补

今天夏至。
做完早八的早餐,就盘算:是按小子他奶奶那边的风俗吃凉面,还是他姥娘那边喝羊汤。
最初按经济账决定吃凉面,谁想小子愁眉苦脸回来,说肚子凉着了想吃热的。
于是出去买羊肉,回来炖了满满一砂锅的羊肉,已经不能称为羊汤了,爷俩吃的是心满意足。

24年高考成绩倒计时

昨天跟媳妇聊天,说她也要参加招生宣传去了。这才意识到离高考成绩公布,已经没有几天了。
于是开始预测新开专业的录取分数线,顺手打开自己的高考数据库,查看了一下去年山东的录取情况。
去年只是把数据简单录入了,并没有怎么看,现在一看,张大拿真是名不虚传,山大垫底五人组大变样,他咋不早说三年呢。
顺带聊到报考那灵魂八问,怎么感觉有些像相声里面那“桃园三结义孤独一枝”呢?

名字印上出版物

今天点校古籍的时候,微信上薛老师来信确定我的姓名,告知前段时间帮忙整理的陈祖德先生对局集要出版了。
活过大半辈子了,还真没想到过,自己的名字会印在出版物上。虽然只是以打酱油的身份。
最初整理陈祖德棋谱,是差不多两年前的事情,封闭在家干事总比不干强,春节期间又忙了阵,干着干着这事情也就成了。
也许很多事情,只要干还是能成的。