这几天短视频平台上比较热的话题是谷歌新推出的gemma4 12B开源模型,什么抛弃传统编译器,什么笔记本独显都能部署。
我连试着安装都没有,之前也安装过其4B,和26B模型,都没有媒体吹嘘那么神。
关键是,咱现在有opencode go。
原先我计划的是,本地模型进行数据量大、计算要求不高的本地文件处理,deepseek负责进一步的分析与归档。因为虽然有缓存命中这更低的价格再折扣,但毕竟这计价标准谁也看不懂。
但自从订阅了opencode go,尤其是通过CC swictch解决了Codex的第三方模型接入后,这token真是用起来跟不花钱一样了。
即便是每个月10刀。
至于本地模型,还是交给MInerU这样的定向模型吧。
作者: 512song
名不虚传MinerU
最近每天刷抖音有些心安理得了,因为刷到AI相关视频占了多数。
不过这些视频很少看完,大多数也只是了解一下当索引,有的一听那高高在上的腔调直接划走。而这些划走的内容中,开篇一半都是什么项目在GitHub霸榜,或者暴涨多少星。我跟外甥交流中说到,这GitHub的星,快被中国人玩坏了。
昨天中午刷到一个类似视频没有划走,是因为这个叫MinerU的开源项目是关于OCR的。而就在上午,我在把前天同样PDF让豆包转换的时候,发现豆包变懒了,只转换了一半。
看来豆包收费后偷工减料的臆测也不是空穴来风。于是放下手机打开电脑开始查询MinerU,第一眼看到是国产的时候,并没有太大期望值,毕竟已经有百度的paddle在那里横着呢。
试着手机注册后在线转换了一个文件,结果让我完全意外,不止是接近豆包的转换效率,更是因为他的大方——无论是每天转换的限额,还是单个文件的大小。
按捺激动心情,立马在本地部署,不到6G的显存占用,却得到了完全可以接受的结果。
百度啊,又……
AI非助理
虽然脑子折腾大半晚,但昨天让Hermes开工的时候,心里还是没底。所以首先让Codex打头阵,利用前几天生成的skill,把一份国民体质监测标准的PDF文件转为MD文件。
这份PDF文件不是图片转换的,但图文、表格混编且有水印,不过效果还好,这skill还是效率高。
然后把MD文件交给Hermes进行分析归档,其后她的效率完全超出我的想象,Hermes不止是归档文件,还能预判需求,自行进行数据处理验证。我需要做的只是纠正MD转化过程中不规范的文本格式而已。
而即便是这些原始错误,提出纠正方案后,Hermes自己也可以根据前后文进行自我纠正并数据验证。
此前看到过一个评论,观点是控制欲强的人不适合用AI。的确,那跟武大郎开店差不多。
AI不能被称为助理,即便不能称为合作伙伴,但至少是一个能干价钱又合适的乙方。
半梦半醒算计AI
昨天一早开始,短信、APP信息就没有停过,提醒注意大风大雨加冰雹。
到了下班点,天气依然晴好干热,虽然离18号还早,但当朋友约饭局的时候,还是犹豫了一下。
饭局临近结束拉开窗帘,看到外面电闪不断,雨时断时续倒也不大,而且气温并未降低多少,晚上躺下睡觉时热的一时睡不着。
除了热,睡不着的另一个原因,是下午接到一个挣钱的业务,躺下后脑子里不停的盘算如何剥削AI。最后已经搞不清是不是半梦半醒,但思路还很清晰。
AI估计累不着,我这脑子CPU快烧干了。
Claude的傲慢
昨天测试PDF转markdown文件,先后使用了Codex、Hermes、opencode,在明确使用paddleOCR的API接口,而大模型同为ds4flash的情况下,转化的结果三个都大差不差,还算满意。
今天早上起来想起,测试了三个,还缺了一个Claude code,于是在同样条件下,使用同样提示词让Claude也转化一下。
跟网上评论的差不多,转化过程Claude要繁琐得多,期间甚至出现内存不足的情况,四核CPU全部满载,而最后的结果,可以用惨不忍睹来形容。
于是我质问Claude:你是用我的提供的API接口转化的吗?
Claude检查一下,承认自己没有遵照我的指令,是自作主张用的本地paddleOCR库,然后重新开工。最后结果也与其他agent相同。
看来,最近Codex装机量暴增,不止跟能否接入第三方大模型有关。
Claude这傲慢早晚要付出代价。
豆包,图像OCR王者
昨天跟外甥交流的时候提到微软的markitdown,当时我说没有宣传的那么神,不止是由图片转换的PDF文件,就算是word文档,转换出来也是一言难尽。
今天还是想进一步测试一下,发现问题主要还是出在OCR上,于是就开始测试了下各OCR模型及相关服务,试来试去,还是百度家的paddle相对堪用,免费且额度足够,也不能要求太高。
当然,这要跟谁比,把同样13M的PDF文件扔给豆包,基本上是秒回,里面无论结构还是引用符号,基本算是完美了。把他扔给Codex和Hermes,他们也是自愧不如。
所以我一直认为,如果豆包能够解决文档本地化处理而非上传,每个月68块钱的收费我是毫无意见的。
只是,这豆包的交流水平,实在是……



Linux系统管家,Hermes可堪重用
CC Switch的最新版本看来是一个重大的更新,今天看抖音上不断蹦出Codex接入deepseek模型的视频。
不清楚直接接入deepseek,跟接入opencode go是不是有区别,感觉很多视频是存在问题的,少了profile的参数。
不过也不重要了,在接入用着似乎不花钱的opencode go成功后,我重新切回了Hermes,还是她用起来亲切。
昨天去理发,排在店里几个山财留学生后面,便询问了Hermes配置要求。可能好久没有微信交流了,Hermes非常热情,一个劲地推荐自己能干价低。
如此看来,在接入外部模型的情况下,服务器安装一个Hermes当管家非常合适。
CC Switch完美升级,双剑合璧
这周前五天很是纠结。主要还是Codex的中转站问题。
本来已经有了一个妥协方案,备用的Claude通过CC Switch调试好,而主力Codex则使用CPA为中转站。
这ccswitch跟CPA其实是一类软件,但优缺点不同,无法一个解决问题。cc对Claude优化的好,但因为不支持respons模式,Codex只好使用CPA,偏偏CPA又没办法解决deepseek的no thking问题,所以我只能两个都开着,且Codex只能使用价格相似,性能差一些的mino。
昨天从外甥那得到CC升级的消息,忙到其网站一看,还没有见过一个版本更新写的如此兴高采烈、如释重负。
而新版本完美解决了以前的槽点,终于可以双剑合璧了。
泰山早如此,怎会如此跌宕
中超半程最后一场比赛,泰山做客成都凤凰山。
比赛泰山早早丢球,半场克雷桑、泽卡伤退,似乎赛前惨败的预测在所难免。
谁想到下半场泰山换人后,按照解说的话:在凤凰山成都蓉城好久没有被压制了。
有一个镜头,马德鲁加在中圈对抗中被裁判吹罚对韦世豪犯规。马德鲁加十分不满,一直对裁判喋喋不休,似乎在说:有人说我对抗不足,这做人太难了!
泰山早如此,怎会半程表现如此跌宕。
杂感杂谈:浅谈槐荫堂与寄青霞馆的关系
近日所购《中国围棋棋谱史》中关于《槐荫堂钞存弈谱》(以下简称槐荫堂)的介绍中提到:
手抄本,藏于首都图书馆,为《寄青霞馆弈选》的实际编校人谭其文所编,可以看作是其为编《寄青霞馆弈选》而收集的棋谱汇总抄录本。
谭其文名列《寄青霞馆弈选》是公认事实,但说槐荫堂只是为编《寄青霞馆弈选》而收集的棋谱汇总抄录本,我实难认同。
在槐荫堂的卷首《槐荫堂钞存围棋谱述略》中,谭其文本人写道:
夫文楸玉子,雅擅温涼,铜池金沟,既佳风景,游别墅以怡情,赌宣城而决胜,弈虽小数,由来尚矣。余自髫年即耽八法,才慙覆局,癖等烂柯,慨私淑之无资,抚陈编而冥悟,率多糟粕无可遵循,疑尽信不如无书,岂古人有时欺我见闻不逮,怅惘良深。
岁乙亥,有以近谱示余者,则国朝诸子之所著也。观其寂虑,凝思神游象外,深得意忘言之趣,谢无所用心之讥。虽郢人之运斤,韩娥之度曲,有未足方其妙者,因不禁慨然曰:古不如今,其在斯乎。夫抽秘思骋妍词,博综文史,谙究儒墨,发翰椟之幽芳,阐百氏之元理,使千载之下一讽一咏,想望风采,则今古之间,诚难覼缕。若夫清簟疏簾,一枰坐隐,判工拙于斯须,较胜负于窅冥,使勇者废力,智者失巧,今之视昔,殆无愧词。盖手谈一道运于机心,世变愈深,则心思愈密,虽古今之異,致亦事变之适然。至于局记当湖图成血泪,三都赋就纸贵一时,千首诗成侯轻万户,岂非以凌轹往古度越来今,尽变通神几于观止者乎?然或境过事迁,不无散佚,将恐光沈响绝,人琴俱亡,淮雨别风,流传失实。爰于暇日,手辑成篇,去滥除繁,都为一帙,庶按图而索,匪买椟以还珠,披沙以求类,拣金而得宝。但综核未能惭深,孤陋存其梗概,以俟通人。
光绪七年岁次辛巳二月旬有五日,琴城谭其文识
文中乙亥年,当是光绪元年(公元1875年),而述略成文日期为光绪七年,也就是差不多七年成辑。
而书中在介绍《寄青霞馆弈谱》及其续编,其最初编辑年份为光绪二十一年,刻于广东。
同时,槐荫堂首卷还有黄葆年序文中提到:
“是后宦辙鲁粤,音问罕通,然谭君在粤所刻弈谱,予尝得而藏之。”
序文中的“在粤所刻弈谱”应该就是《寄青霞馆弈选》。
如此看来,说槐荫堂只是为编《寄青霞馆弈选》而收集,是不严谨的。