可惜了grok的图像处理

昨天短视频平台上xAI关闭的视频时不时蹦出来,但转到快科技这IT网站却没有看到,后来搜索,只有一条“xAI将终止独立运营,整体并入SpaceX”的新闻。
马斯克在SpaceX今年IPO前将xAI并入,是为了提升其市值,并非关闭xAI,只是将他转为自用,并将富裕的算力租给Claude,让他跟ChatGPT继续斗去。
不过我还是觉得挺可惜的。grok我用的主要是他免费的图像生成,但相比banana和image2,我更喜欢grok的图生图,他更能理解原图并更真实地呈现。
本来还想着等小子上学去了,我抽出一个月时间,买grok的会员,突击转化部分老连环画。
可惜了。

三星显示器黯然退场

三星停售所有家电产品,在另一篇报道中,有一句挺有意思的话“包括卖的还好的显示器业务”。
只是还好。
前几天我买了现国内排名第一的AOC的显示器,曾感慨:当年谁看得上他。
在科技市场年代,显示器是飞利浦与三星争霸,买别的品牌只能是图个“性价比”。
开始是觉得飞利浦强于三星的,后来发现同价位的显示器,三星实行的田忌赛马策略,用中低端S系列,跟飞利浦的主流A竞争市场,这已经足以慢慢把飞利浦挤出赛道。
现在这一策略已经过时,只能自己黯然退场了。

自我提升的Hermes

五一假期后两天,就没有再剥削Hermes劳动,只是简单通过微信提问了一些问题,检查前期工作成果。
Hermes的确很适合初入门者学习及使用。他简单高效,跟搭建积木一样,而且他还自己能识别、搬运、修正。
前期我安装了hindsight进行memory管理,昨天结束的时候,让他把最近工作流程保存到hindsight中。开始他报错了,说无法保存。
我正头疼怎么处理,但还没等我开始搜索资料,Hermes已经开始自己检查配置文件,并提出修改方案,然后一番忙活,报告hindsight正常运行了。
自我修正提升,这是传统软件系统不能想象的。

五一不放假的Hermes

五一假期第一天,我们全家躺平。
今天中午出去吃饭路上,我想我们休息,这Hermes不能闲着啊。于是通过微信给他下达指令,让他对前几天爬取归档的数据进行数据挖掘与分析。
这Hermes跟他交流起来费劲,但人家自己干起活来那个真叫高效,一会功夫数据就整理好了。
我夸了他一句,他更是来劲,开始放飞自我,高端的词一套一套的,我只能是复制黏贴他的话进行下一步工作。
后来想,这家伙不会是忽悠我吧,找了个专家把Hermes的分析发过去,确认上纲上线均在理。
下一步,就是按照他的要求输入更多的数据了。

初始Trae SOLO,超出想象的厉害

昨天白天忍着性子跟Hermes“交流”,爬取上次网站的另一格式的页面。这有记忆并非好事,他时不时又会参考已保存的skill,导致爬取的网页元素不全。
好歹最后问题解决了,看着数量不断增加的文件,突然动了测试Trae SOLO模式的念头。
我把Acer笔记本重新安装Linux,最初主要是想应用Trae,因为现在使用的系统都是部署在Linux下的。
最近这段时间用AI生成了不少图片,就像做一个简单的系统,把这些图片管理起来。原先想的是用Django做的,外甥一直推荐js,便切换SOLO模式后,随手输入了两句开发要求。
点击发送后我就有些后悔,这要求写的太简单,后期需要进行补充反而更麻烦。
没想到Trae似乎已经明白我的要求,而数据库选择sqlite也在我的意料中,一阵忙活后一个系统就做好了,除了忘记做初始页面,系统就可以使用了。
虽然已经知道AI开发功能厉害,但这么厉害还是出乎我的意料之外。
最细致之处,就是他完全预估了我的需求,系统的原图片是可选项,因为AI生图可以纯文本生图。
前几天一位老哥说我们也就还有两年的蹦跶头,现在看,还是可以活到老学到老。

Hermes,严以律己

昨天给Hermes加入hindsight记忆引擎,保证其自学习能力后,又安装了一些基础skill。试着查询五一期间济南的天气,通过Tavily的使用记录看,安装顺利。
下午主要实验了一下爬虫功能,可能也跟网页规范有关,这次跟Hermes交流就顺畅多了,很快就开始按照要求爬取数据,同时看到hindsight也进行了更新。
但到了做晚饭时,脑子不知怎么短路,顺手把Hermes退出了,结果做饭期间查看下载文件,还停留在退出时的数量上。
重启Hermes,文件在继续下载,但Hermes却一直在忙活,检查完进程核查代码。这次自言自语跟以往同我对话一样,也是不停自我批评和自我加码,最后修正一个重要错误后,滚屏结束。而爬取生成文件速度明显加快。
看来这Hermes还是不要轻易退出为好。
昨天大模型使用的是qwen3.6的35B,印象大为改观。

Hermes,交流与沟通

昨天一早把Hermes接入到微信中,非常顺利,跟新加联系人一样,扫了个二维码,发了个确认码就成功了。
之后就忙别的去了,到了傍晚想起测试一下微信操作Hermes,于是想把微信中最近收到的合同扫描件通过Hermes归档管理,结果一折腾就折腾到眼睛快睁不开。
开始以为是本地部署的大模型不给力,切换到deepseek,依然无法实现Hermes把文件上传到指定资料库目录。
一番扯啰后,最后Hermes终于明白我的意思了,完成任务后才生成了skill。
这Hermes聪不聪明跟大模型性能真没关系,他们二者是相对独立的,Hermes有自己的理解和行为方式,以合同归档为例,他认为只需要把文件作为一个占位标志即可,这样管理更为高效。我认为Hermes听不懂我的话,可能他还觉得人类怎么这么笨。
此外,我认为Hermes与大模型相对独立,是因为Hermes在运行中提到一个将PDF转为图片显示的方案,但他却没有意识到deepseek不是一个多模态大模型,无法识别图片的。如果是大模型为主控,是不会最后无法运行才提示的。
看来,这Hermes越来越聪明,不是我们人类教的,而是互相沟通的一个进程。

安装Hermes

昨天显示器到货后就开始安装Hermes。
安装很简单,但过程很漫长,依然是国内网络的问题,主要卡在GitHub的访问上。安装完成后的界面似乎时光倒流,回到了三十年前的CRT显示器面前。
在设置连接了本地gemma4大模型后,试着做第一个skills,从从一个网站爬取京剧剧本。选择这个网站,主要因为这是一个老网站,以现在的标准看,网页简陋而不规范。
过程很不顺利,Hermes爬取的网页开始是缺胳膊少腿,后面则是把无关的HTML元素也爬取下来。我只得一次次纠正提出修改意见。
别说,这Hermes态度老好了,每次都诚心接受错误,表明决心,言语中一再表示这是“最后一次”,让我有当年辅导家里某位小朋友做作业的无力感。
换成qwen3.6,结果还不如gemma4,直接罢工。
于是狠狠心,切换到deepseek v4的flash版,它分析原爬虫程序后指出了问题所在,并进行了修正,完美解决。
看了看费用,花了7分钱。
当然,这是在很多低效率沟通的基础上,如果是那些重复冗余的工作,花的钱就不会这么少了。这也是我此前对龙虾类agent不是很感兴趣的原因:自己有编程能力解决,手工操作未必低效。
题外话,通过使用Hermes发现自己果然是穷鬼出身,因为在使用网页搜索时才知道,原来Hermes就是大名鼎鼎的爱马仕。

首购AOC显示器

最近在用的Acer笔记本,是18年买的,当时图优惠,估计生产年代更早,得小十年了。
笔记本用起来还好,当年的初代katago就是在他上面彻夜大战leelazero,但就是显示器指标实在是差,最近用惯了高清显示器,现在看他的显示器时间长了泪水都能流下了。
换显示器犹豫了很久,先是买不买,后来是买27还是23的,昨晚感觉实在不能再等了,再等这边电梯换装可不想搬上楼了,看到AOC的优惠,还是下单了。
今天显示器到货,箱子比优派小不少,如果上次买的是AOC,估计就不会摔得那么惨了。
买AOC的一个原因是他居然在显示器市场上排名第一了。
当年,谁看得上他啊。