数据污染的例子

周末在整理优化程序的时候,又被开源大模型给雷到了。
因为获取原始数据中,比较头疼的是日期格式错误,之前自己编写程序校验,这次交给几个大模型写代码,结果跟上次一样,几个新大模型给出同样的答案,而且错的极其离谱。
上次好歹只是得不到准确答案而已,这次好家伙,函数里面直接出现了空白字符。
这就跟小时候老师说的:你抄也找个好学生抄啊。
最后是原始模型llama3出面解决了问题。他给的答案是非常官方化,也就是最为简化,具体使用起来,还需要进行数据预处理。这就是那几个不肖徒子徒孙,在迭代训练中中,不知抄了哪个论坛里面转了不知多少遍的帖子。
这就是AI时代数据污染的一个例子。

专业壁垒总是存在

最近整理古谱,这落到纸面上的,跟发到网上的不一样,真是不一样,一句一字不容有错。原先只是爱好而已,错了就错了,发现了就改,发现不了就那样了。
最后还是买了一本手册作为参考,翻看起来,发现很多古文知识都还给高中老师了。
今天视频又看到张大拿讲专业壁垒。这文科怎么就没有壁垒,或者很低了,正儿八经学四年积累的知识,是非专业不能比的。这就像专业与爱好水平比拼一样。
当然,四年不学混日子那就不提了。那不是壁垒高低问题,是开门揖盗了。

“有趣”毁了孩子们的前途

晚上泰山对浙江联赛直播前,看了一段《足球之夜》对女足新任主教练的采访。
不用笑中国足球,现在央视不止解说员,主持人的水平也同样大滑坡。采访澳大利亚主教练,哪壶不开提哪壶,让他跟自己同胞,前两天刚下课的U17女足主教练相比。
不知消息来源是否准确,主持人说下课的那位,接手U17女足,是因为“有趣”。
如果是,那昨天还骂轻了,这老匹夫。
随后泰山轻松击溃浙江的比赛进程与结果,也印证了我的说法。
乔迪坚持他的传控打法,而泰山的阵型让黄健翔都感到意外。其实崔康熙的战术就是全场紧逼,场上球员就算是新人贾非凡,一对一也是泰山占优,你这洒沙子般的传控,就是自寻死路。
国家女足只是少了两年的大赛,而U17的孩子们,可能被毁了前途。

一顿饭与一生的饭碗

早上等公交车的时候刷新闻,在一个分类新闻中不起眼的地方,看到了中国U17主教练终止合同的的标题。
郁闷的心情略微舒缓了一下。
前段时间整理资料时候,用画中画小窗看了几场在巴厘岛举行的U17女足世界杯亚洲预选赛,在前三名出线的情况下,女足在三四名决赛中输给韩国队,丧失了出线资格。
看着又黑又瘦的小丫头们,踢着所谓先进的传控战术,如洒沙子一样在禁区里外与对方球员纠缠,就想这澳大利亚主教练岂止是误人子弟,简直就是断送孩子们前程。
在中国足球大环境下,如果这帮孩子能够进入世界杯,不止提高了她们的大赛经验和眼界,她们的职业生涯也会改变。
结果她们成为外国主教练的试验田产品。这老家伙只是丢了一顿饭而已,女足球员们可能是被砸了一生的饭碗。

弥补短板,大模型依然脱不了大量训练

很久没有用ChatGPT了,因为想了解一下GPT-4o,才又登录上去浏览了一会。
临退出时,想到前段时间开源大模型编写Python程序拉胯的事情,于是就便把同样要求向ChatGPT提出,它很快给出了答案,相比上次唯一合格的Phil3,代码更为简单直观。
然后比较了一下代码,也明白了几个大模型出错的原因,我当时要求的是把符合要求的字符,用{}把包括起来替代。偏偏这{}在Python语言中,有特殊作用,那几个大模型就是忽视了这点才无法生成答案。
看来,这AI离不开的还是大量的训练。

物是人非,变不了天

变不了天。
微软这颇有些当年win95发布的阵势,同样的对手,物是人非。
前几天刚讨论过被夸大其词的RAG,当时提到其核心依然在大模型,而不是向量数据库。而前段时间推出的GPT-4o应该就是担当此任。
现在看我们分析是对的。所谓的Recall其实就是微软的RAG产品,本地存储运行向量数据库,则可以打信息安全的擦边球。
只是以微软这些年来拉胯的表现,最后肯定是中途半端,成不了大气候。

PC行业要变天了!微软祭出杀手锏:苹果接得住吗-快科技-科技改变生活

微软的谜之自信

“等了二十多年,终于拿到王牌,我们定能力拔头筹”
这与当年乔帮主那句“Intel还不够好”一样,让Intel情何以堪。
现在看来,这波浪潮主导者是微软,而不是高通,只是Windows系统那对硬件性能拉后腿,甚至可说是使绊子的表现,想抗衡苹果,难。

微软再次稳操胜券-快科技-科技改变生活

痛苦因为没有遗忘

周五开工后,用脑用眼,累得不轻,原先一般都是一累梦都懒得做了,今早的梦是那么真切,真切的过程,真切的细节,更为真切的是情感。
梦里似乎还记得这只是梦,因为一个劲的在提醒自己,安慰自己,却又一个劲愤懑地心理怒吼:我已经经历过一次了,为什么再来一次!
一天下来,不敢想,却又时不时脑海中重现梦中的情景,对应着真实的回忆。
最后也释然了,痛苦是因为还没有遗忘。

迷你机彻底上岗

昨天新组装机器运行正常,今天数据转移完毕,并测试新业务无误后,彻底把原机器关机了。
这台迷你机,价格相比我原先组装的联想m93,相差不大。M93强在性能上,毕竟给它配置的CPU是E3至强,而迷你机则胜在功耗和够用的性能。
现在有了AI服务器,一起性能有关的业务,都交给它了。
顺手到网上看了一下,M93的价格居然大涨,几乎快翻番了。看来追求性能的人还是不少的。

服务器换岗

纠结于换不换电脑已经又过了半年了,最后决定不换了,把家里服务器替换下来,加块显卡替换现有机器。而顶替服务器的,则是新看中的一款mini准系统,小巧、静音,关键还是双2.5G网卡。
机器并非京东自营,虽然是顺丰发货,但还是比配件到货晚了几天。
打开包装机器拿到手里不用掂量,只是这塑料外壳材质,就明白为何便宜了。不过看在这价格上也不苛求太多了。
开机装好SSD硬盘和内存,原先为SATA接口硬盘预留的挡板没有装回去,这样增大空间,提高散热效果。
机器运行正常好,开始进行系统大搬家,前期准备工作充分,顺利完成。
下一步,就是纠结换什么显卡了。