1:1,死缓

中国队主场与泰国队的比赛以1:1收场,等于是判了死缓。
实在看不懂伊万的排兵布阵,早早换下高天意,是为了惩罚他丢球的责任,还是对自己菱形中场的否定?后来不出所料换上蒋圣龙客串中锋,这是全中国球迷都知道的套路,偏偏再加上一个正牌中锋张玉宁,这是嫌禁区太大,还是嫌传中球不够分的?
其实伊万自己都郁闷,这些球员平时都挺好的啊?
其实这场跟前两场中国队与新加坡的比赛一样,症结在于一对一对抗,尤其是正面对抗,中国球员已经处于下风。这就不止是身体素质的问题了。

高考碰上端午

下午回家路上经过附近一所中学,看到校门口的护栏已经设置好,后天就要高考了。
今年高考正好赶上端午节,儿子他们并不放假。据说高考期间大学不放假也是传统,不过,大学也分年级,要是找大三学生替考,估计是自投绝路。
对家长们而言,高考赶上长假,也不至于请假,上班的也不用分神,倒是好事。
祝好运。

比大模型抄袭更丢人

今天浏览科技新闻,最热门的就是斯坦福的大模型抄袭,这已经算不上丑闻,堪称闹剧了。
以我最近测试几款著名开源大模型的经历,虽然为数不多,但从那雷同而雷人错误看,大模型抄袭显然已经是普遍现象了。
而斯坦福这三个小丑如此丢人,一是人品极差,甩锅的甩锅,跑路的跑路,更关键的是,这llama本来就是你们家斯坦福的杰作,你却绕着弯抄袭徒子徒孙的大模型,真真是丢人丢到家了。

读书人的颜面

最近没有更新自己的公众号,主要是因为忙于点校古谱。
原先在公众号号也发布了不少文章,但基本属于兴趣所致,随性而为,发了也就发了,错了也就错了。
而现在点校开始后,真的不敢再有马虎二字。这跟稿酬没有关系,算是读书人的一点颜面吧。
好歹算得上是读书人吧。
今天整理到《眉山墅隐》,回看对照原先的文章,真是汗颜。
希望完成本次工作后,能换一种方式更好整理古谱吧。

俄罗斯方块机快乐源泉

从网上买的俄罗斯方块机到了,虽然比我三十年前扬威宿舍楼的正版Gameboy差不少,但技术进步,也能流畅玩了。
起买这个俄罗斯方块机的念头,是61前跟蹭节日的小子吃肯德基的时候,他选了一款赠送玩具的套餐。
而之前玩过的俄罗斯方块机里面,最接近Gameboy的,就是很多年前肯德基套餐赠送的。
虽是赠品,但做工不错,而且游戏是通过插卡来玩的,就是接触差一下,他爷爷玩的时候,时不时要用手拍一下机器,保证游戏正常运行。
估计受奶奶的灌输,儿子对爷爷玩游戏也颇为不爽,一次眼疾手快地把游戏卡从机器上拔出来,还义正辞严地说道:不要影响我爸爸学习。
那是这一生中最快乐的时期了。

吃老本的搜狗

前几天因为讨论ICQ关门的事情,跟外甥聊到了输入法,从自然码到紫光2.3,最后到了搜狗,也就没有再换。
最近点校古籍,使用搜狗并不顺手,但因为基本都是古文,便也忍了,但今天开始整理民国时期的书籍,搜狗依然不给力,高频词总是不能提升位置,于是换成系统自带的微软拼音。
用起来才发,除了设置功能少了点,没有中文符号自动完成,其他功能完全碾压搜狗。
搜狗吸引人的在于他的联想词和网络词,这在整理古籍资料上用不上,而我感觉他处理高频词性能糟糕,是受到强调网络用词的拖累。
再者,没有竞争者情况下,搜狗开始吃老本了。

主教练抢戏

今晚女排大奖赛澳门站,中国女排在扳回一局后,后两局崩盘败给日本队。
不知道转播信号是由何方提供,慢镜头回放中竟然重放了上一场袁心玥与朱婷未击掌的一幕。
此后朱婷上场后,估计吸取教训,转播中减少了场上球员交流的画面,镜头更多给到场边主教练蔡斌。
按照朱时茂的话:抢戏,你这是抢戏!

尴尬的复出

昨晚整理资料同时,开小窗看了中国女排对荷兰队后三局比赛。
比赛算不上精彩,先输一局的中国队在手握三个赛点时,让回归的朱婷上场发球。
排球不是足球,更不是篮球,朱婷也不是洛杉矶时的侯玉珠,这尴尬的出场亏主教练想的出来。
面色凝重的朱婷刚要发球了,对方主教练也来添乱,提出上一球的挑战。这使坏如此明显,连主裁判都笑了。
还好,不出所料丢了一个赛点的中国队,拿下关键一战。
今早看新闻,袁心玥不与朱婷击掌的新闻又上了热搜。
这添乱的真是不嫌事少。
一个巴掌拍不响。
同样二人谁也不敢先出手,生怕拍到空气徒添尴尬。
不能说有宿怨,至少是心存芥蒂。
朱婷也不是半退役后回归的张常宁,东京惨败后惨淡经营的团队姐妹,对强调伤病却还在国外打职业比赛的朱婷,没有怨言没人能信。
现在回看朱婷的归自媒体宣言中,那“不接商业代言”等字眼,不是推脱,更像是一种官样的表态。
强扭的瓜不甜,由她去吧。

AI时代传统文化的歧路

最近整理的古籍,其实也已经算不上古籍,已经是民国初年的书籍了,即便如此,那半文言半白话的文字,点校起来也颇为头疼。
如果让现有AI大模型处理,肯定还不如我,这点自信还是有的。
即便把文字录入让AI进行训练,效果也好不到哪里去,因为分词这关就过不去。
GPT之前的AI破冰,是AlphaGo,更进一步的则是后续zero,从零开始的自学习提升。
围棋是可以的,因为有胜率这个衡量标准。即便如此,各国不同规则也限制了其胜率的判断。
而现有很多领域,AI是没法替代的,比如中医,就像我们高三同位说的那句“赵啊,咱古文学的差,就别学中医了,书上说巴豆不可轻用,咱别一下给上半斤”。
同样,中国传统也不要因AI时代而被轻视甚至否定。
百年前,三家店被打倒,卷到历史垃圾堆里,其中用的就有赛先生这面大旗。

数据污染的散播

昨晚写完数据污染的随感后,刷了一会抖音,正好看到一篇关于“提防看正史”的视频,讲的就是像现在拿正史抬杠的,不少“正史”资料都是某大厂AI生成的类似“魏武大战光武”的胡言乱语。
我最近改变计划,着力搜集整理相关资料。其中搜集了大量关于中医类的AI数据集,这自然要感谢那些资料整理者,但其中也发现部分资料中掺杂着“某某品牌产品对某某症状有疗效”的数据条,而且为数不少。
这就有些类似当年cms时代,采集器采集回来的内容中夹杂广告。
但这些更像是有意为之。
如果用这些数据训练大模型,那么“某某药酒包治百病”这样的笑话,就不是笑话了。