因为被即梦的seedance震撼,于是开始学着做视频。这个过程中发现,视频的静态模型,无论是人物还是背景,都非常重要。
但即梦自带的文生图和图生图效果并不让我满意,于是从昨天开始我试着沾点谷歌的便宜,用每天的banana2的免费额度,试着用喂给即梦的连环画图片生成影视剧图片。
结果,再次被banana震撼到。
如果是seedance的震撼源自从无到有,而banana则是将现有资源,提升到一个难以想象的高度。
将banana介绍给在即梦做出大片级视频的网友,他开始反应是banana相比即梦提升了一个档次,再试后,他收回了评价,直接开始转用banana。
这一周,感觉自己面对AI的进步,真的迟钝麻木了。
分类: IT天地
从数据污染到数据投毒
央视315晚会曝光的GEO技术,已经不是一个新问题,我在大模型流行初期,在测试大模型调试、及训练的时候就曾意识到,只是当时起的名字叫数据污染。
中文AI大模型早期被人诟病甚至耻笑的一点,就是张口就来、胡说八道,什么关公战秦琼,黄龙士大战李昌镐,这主要原因是训练数据来源本身不过关,从网络上搜集的资料良莠不齐,反过来还重新污染网络。
后来测试大模型调校时,发现用来训练的中医数据集中也存在诸如“鸿茅药酒包治百病”之类的数据。这应该不是数据生成者手滑眼花所致。
污染变投毒,看来AI大模型相关的商业利益更大了。
这种形势下,不说安全性,保证数据的完整、真实性是第一位的。
最后一次说广电网
本来不想说广电的坏话,就像一直不说百灵网坏话一样。
广电网与百灵网之间,是难熬的内置modem上网期,虽然广电网存在着拨号系统落后,网络不稳定、ARP风暴等诸多问题,但价格是真便宜啊,便宜到可以忍受所有问题。可以说,没有百灵网和广电网,山东的低价宽带网费不会位居全国前列。
昨天生气的地方,在广电营业厅的服务人员对有线电视的贬低,什么同轴电缆落后等,那好歹是自家产品。
都说现在有线电视现在没人装、没人看了,具体是谁的责任,肯定不是用户的。为了拓展新用户而放弃传统用户,往小里说是何等短视,扣个大帽子,就是浪费国有资源。
垄断的傲慢与懒惰。
大模型时代 拉存款时代
今天看新闻,腾讯在深圳腾讯大厦北广场举办OpenClaw免费安装活动,现场由腾讯云Lighthouse工程师提供一站式服务,涵盖安装部署、模型配置、IM渠道打通及热门技能解锁。
看到这个新闻,第一反应怎么是当年银行在网点、小区门口摆摊,给新用户开卡。
OpenClaw不是大模型,它只是一个AI自动化引擎,需要通过API连接大模型来完成各种交互任务。
你说鹅厂门口摆摊,是安装的哪个云服务的OpenClaw容器,连接哪个大模型,肯定是腾讯云加腾讯混元啊。
当年银行上门服务开卡,抢的是客户,赚的是存款,而现在鹅厂工程师抢的是份额,更是那源源不断的tokens。
不愧是腾讯。
千问反间计?
昨天阿里通义千问团队出现多位人员变动的新闻,引发网上热潮,专业的、看热闹的都来蹭热度,什么KPI考核、团队摘桃子等等等,估计是都市商战剧、古代宫斗剧看多了。
千问成功与否,乃至重要性如何,阿里作为一个商业帝国最有发言权,自然也有决定权。
千问团队没有讨价还价的资格。
有意思的是,目前要挖人的谷歌,偏偏在传闻中就是他的deepmind给了千问差评,导致阿里做出改组千问的决策。
莫非这就是传说中的反间计?
千问负责人辞职因为无望
今天看到一篇文章将近日千文负责人辞职的原因,归咎于阿里部分高管对刚发布的 Qwen-3.5 并不满意,认为其仍属 “半成品”。
其实所谓的不满意,针对的不是3.5这个小规模版本,而是qwen这个产品。
有deepseek作为标尺,qwen始终就是半成品的水平,而追赶无望,推倒重来成本太高,只能是临阵换帅。
还有一种可能,那就是即将发布的deepseek V4,又将国产大模型的水平提升到一个新阶段。
难以理解的的谷黑
冬奥会结束,网上关于谷爱凌阴阳怪气的评论开始多起来。
幸亏她最后U型池夺金,否则更要被黑得没边。
虽是现在是流量为先,但难道只有恶意才会招来更多容量吗?
如果谷爱凌没有出名,在外国人群中,还能说她符合中国人的审美观,而混在中国人群里,估计说她洋气都难。
这又何妨?
且不说她的血统,即便是中国,选手,对国家的认可,对国家成绩外的贡献又有几人做的到?
吃相难看的微软
昨天本想打开家里机器win10系统下的secureboot功能,在按照北京那边机器的流程修改完各项设置后,重启机器的时候,提示找不到可启动系统盘。
当时汗就下来了。这可是历史数据最多的机器,偏偏数据很久没有备份了。
强迫自己冷静下来,感觉问题应该出在BIOS设置上,因为家里跟北京的机器虽然CPU相同,但主板不是一个厂家,于是调出启动菜单,不再指定启动硬盘而是选择Windows启动选项,终于在一手汗的情况下,看到了熟悉的Windows登录界面。
微软将系统与硬件捆绑是老伎俩,但不满足条件直接不让安装Win11是最绝的,而为了强推Win11,又与软件及游戏商勾结,这吃相实在难看。
OCR,人工与AI的桥梁
文中所说2025年末2026年年初,科技圈最卷的技术是OCR有些过,因为OCR本身就已经很成熟了,其实卷的是文档排版的识别。
而科技圈开始卷OCR,很重要的一个原因,应该因为它是人工资料与AI的桥梁。去年我对图像转化的PDF文件识别,豆包的识别率要高过元宝一个层级。
想来,最受伤的应该是百度了。OCR是我目前唯一还在用的百度产品,曾经的领先技术,甚至成熟的产品,在新技术面前,一切归零。
OpenClaw服务的坑
大前天Moltbot爆火后,第二天就看到有评论,说Moltbot前脚改名,腾讯后脚推出了每月38元的Moltbot套餐,真会抓赚钱的机会。
今天又看到新闻,这Moltbot又改名OpenClaw了,百度也跟着推出了基于轻量应用服务器的限时免费服务。
百度现在总是慢半拍。
不过说是免费,但看看一键部署教程里面的API key设置,感觉这个坑不小。好在现在大模型服务都是预付费的,如果跟刚普及3G年代一样是流量后付费,那可真要小心,睡一晚上,房子没了。