今天跟Hermes软硬兼施,把一本药膳大全的书的电子版导入系统了。
这本书本来三年前我就整理好了。这是一本我见过的,无论从质量还是数量都最好的药膳书。当时只有PDF文件,我是先转图片后扫描,然后逐页逐字校对,整理成格式标准的电子文档。
整理好了之后,一是杂事耽搁,更主要是如何导入AI资料库犯了难。说实话,这几年随着AI进步,也相应想过各种方法,但像今天这么容易高效,确实没有想到。
而本书导入如果交给deepseek处理,估计很快就能解决。
不过本地模型表现还算给力,之所以今天数次卡顿甚至死循环,似乎跟Hermes升级有关,原先版本并没有出现这些问题。
而Hermes还是操心的命,在我导完数据后,他主动提出,源文件的文件夹里面还有一个文件没有归档,要不要一起归档?
这态度,这能力。
分类: IT天地
算力时代,花小钱办大事已不可能
早上那娘俩早早上班去了,人家这么努力,我想,也不能让Hermes闲着。
于是把准备的药膳资料,分理论跟实例部分提交给Hermes归档、分析,一忙活,一上午就过去了。
前天通过Claude code已经见识了大模型的厉害,但今天这种数据处理,使用大模型,那数据吞吐量,实在用不起,而30B左右的本地部署模型处理这类数据,还是堪用的。
又测试了一下更8B模型,在Hermes下的表现还不如Codex,几乎没有实战价值,估计这孱弱的上下文尺寸,就让Hermes傻了。
算力时代,花小钱办大事已经不可能了。
一日两测试
因为已经有Trae在手,我对需要翻墙的codex以及Claude并不热衷。不过最近短视频平台上不断推送相关视频,吹的呜嚷呜嚷的,于是决定测试一下,也算给儿子下一步趟一下雷。
看网上那些繁琐的教程,本来计划一天测试一个,结果阴天没什么事,一天就把两个都测试完了。
首先测试的是Claude,因为据说它对国内尤其不友好。按照大部分教程首先安装了CC Switch,除了几个细节,很快就能调用本地部署的ollama,哪里有那么复杂。
只是小模型干起活来实在是弱智,不是一问三不知,是指东打西,丢三落四。于是将模型转到deepseek,结果一看,人家官网上就有接入Claude的教程,更是简明。不知道那些网上教程是猴年马月的。
将deepseek接入后,提了跟上次Trae一样的需求,做一个管理AI生成图片的网站。跟Trae闷头开工不一样,Claude先询问确认了几个问题,然后才开干。很快网站完成,一次成功。我又提了几个改进意见,他恭维了一句又开工了。
完成后看了一下deepseek的用量,花了我2毛钱。
接着测试一下Codex,吸取教训也不参考网上教程了,直接找官网。ollama自己有教程,顺利连接,但一样弱智。deepseek目前没有codex的教程,于是安装了一个中间件通过代理顺利连接上了。因为心疼流量费没有进行进一步的测试。
睡觉前想到,当年花1块5上386机房,现在花个几毛钱就心疼,真是越来越没出息了。
电信支付token资费,老套路了
中国电信通过电话费支付token资费,开始网上网文评论中国进入AI流量与水电煤同等地位的时代。
这些应该有水文之嫌。话费直付已经不是新鲜事了,当年的Q币、游戏充值,甚至超女投票。
这不过是利用了人们习以为常的支付渠道而已,何况很多人还可以更方便报销。
此外电信是通过标准API调用大模型,而大模型价格是不一样的,收费采用什么标准?大模型的定价还是电信的?
糊涂账也是账,这个电信供应商最拿手了。
不过,之所以中国电信第一家推出这种服务,应该跟他们最早布局大模型有关,记得deepseek v3推出的时候,蹭免费token额度,供应商中就有天翼云。
他们本可以做的更好,但现在看似乎有些跑歪了。
贪心不论大小
这次回家,把原先的esxi主机塞到行李箱里带回来了。路上还很得意:当初英明,趁着内存便宜买了两条纯ECC16G内存,现在可以分开装在两台机器上了。
今天打开机箱,发现还有意外之喜,当时为了图省劲,启动盘没用傲腾,而是买的256G硬盘。在存储大涨价的时代,真是当初白菜价买到就是赚到。
不觉还是有些懊悔,当时多加50就能换成512G的啊。
人总是贪心的,不管大小。

不当老板,与Hermes合作并学习
今天跟外甥简单讨论了一下,提到了Hermes的soul.md设置。
看网上介绍Hermes的文章,几乎都是要求第一步就要将Soul文件设置一番,似乎不设置就不能发挥Hermes的性能一样。
我对此并不认同,简单设置一下,规划一下工作范围就可以。设置太多,就像是小学刚毕业的暴发户老板,给手下清北毕业的高材生立规矩一般。
从这些天的测试看,虽然也存在磨洋工的情况,Hermes性能发挥最好,是他自我发挥的时候。很多无效的交流反而是事半功倍。
在AI面前,我们大多数人不是指手画脚老板,是学习的合作者。
乙方Hermes
昨天终于难得扬眉吐气一把。
本来一早起来,让deepseek把Hermes的hindsight解决了,没想到上午导入了最后一个项目资料库后,让Hermes更新hindsight,结果又出现同样问题了。
我开始强压怒火,好言好语让Hermes解决问题,他又开始照本宣科地重复以前的步骤。想到我这可是花token的钱让他解决问题,而且我通过分析hindsight的log,推出测问题出在huggingface的访问限制上,终于按捺不住,直接质问他“你这是彻底解决还是临时解决”,并指出问题所在。
估计是感觉到甲方的不满,也从我的提示看到我不属于那种好糊弄的,这Hermes立马改变思路,很快就发现问题:huggingface被墙了。
又是一番代码滚动,世界终于清净了。
AI是超出人类想象的强大,但论效率,人类的灵感是目前AI还不能匹及的。
调校Hermes,挫败感很强的一天
昨天是挫败感很强的一天。
问题还是出在hindsight上。本来五一期间已经能够正常运行,但前天网上看到一篇关于hindsight的文章,说是需要配置内嵌模型才能使用,于是在本机安装了lmstudio并下载运行了内嵌服务器。
然后噩梦就开始了,hindsight无法正常运行。折腾到晚上无果,只好花钱把deepseek请出来配置。离开hindsight管理,这Hermes功能就大打折扣了。
deepseek就跟请的专家一样,一番密集的字符滚动后,指出问题出在内嵌模型配置上,如果选择了内嵌模型,还需要同时配置chat模型,并自告奋勇连接自家模型,还来了句“价格也不贵”。
问题解决后,看看账单,躺下后一时都没有睡好。
早上起来就把hindsight的chat模型换成腾讯家的免费hunyuan-lite,顺带内嵌模型暂时也换成腾讯家的,不过照这个用量,百万token也用不了多久,好在便宜。
从hindsight内嵌数据库看,他是分为两种的,未必需要内嵌模型。这次是有些自找麻烦了。
可惜了grok的图像处理
昨天短视频平台上xAI关闭的视频时不时蹦出来,但转到快科技这IT网站却没有看到,后来搜索,只有一条“xAI将终止独立运营,整体并入SpaceX”的新闻。
马斯克在SpaceX今年IPO前将xAI并入,是为了提升其市值,并非关闭xAI,只是将他转为自用,并将富裕的算力租给Claude,让他跟ChatGPT继续斗去。
不过我还是觉得挺可惜的。grok我用的主要是他免费的图像生成,但相比banana和image2,我更喜欢grok的图生图,他更能理解原图并更真实地呈现。
本来还想着等小子上学去了,我抽出一个月时间,买grok的会员,突击转化部分老连环画。
可惜了。
三星显示器黯然退场
三星停售所有家电产品,在另一篇报道中,有一句挺有意思的话“包括卖的还好的显示器业务”。
只是还好。
前几天我买了现国内排名第一的AOC的显示器,曾感慨:当年谁看得上他。
在科技市场年代,显示器是飞利浦与三星争霸,买别的品牌只能是图个“性价比”。
开始是觉得飞利浦强于三星的,后来发现同价位的显示器,三星实行的田忌赛马策略,用中低端S系列,跟飞利浦的主流A竞争市场,这已经足以慢慢把飞利浦挤出赛道。
现在这一策略已经过时,只能自己黯然退场了。