同样问答,新必应眼见的巨大差距

在bing推出集成了ChatGPT的新版本新必应后,我也使用微软账号提交了注册申请,但被提示在候补行列中。

今天使用bing的时候,看到自己可以使用新必应的提示,但需要打开edge才能使用,真是肥水一点不流外人田啊。

提问了一个已经得到ChatGPT答案的问题:历史围棋名局的定义标准是。

新必应提供答案速度倒很快,并在答案中用数字标注了答案来源。

只是这文抄公般复制粘贴的答案,实在没法跟原版ChatGPT那堂堂正正、冠冕堂皇的答案相比。

毕竟必应是搜索引擎,哪怕是千分之一的市场占有率提升的背后,也是广告带来的滚滚红利。

估计下周发布的百度也是如此。


NVIDIA强大有其道理

昨晚安装机器顺利,但调试系统始终磕磕绊绊,主要原因是各种系统需要运行的计算平台、运行库的版本存在差异,甚至冲突。
而最为突出的就是cuda,以katago为例,即便同为11版本,11.2与11.3下编译的程序就无法兼容。
今天晚上同样焦头烂额,不过也有所得。那就是发现NVIDIA的教程虽然版面简陋,但写的的确详细明了,即便发行的专业书籍也不过如此。
此外因为反复下载驱动及程序,那官网的速度真是飞一般急速。
看来人家黄厂长能挣大钱不是没有道理,也舍得本钱啊!至于后面尾灯都看不到那两位,还争什么第二啊。

二手显卡到手,满意

昨天真正惦记的还是高价购买的显卡。在淘宝网上,这显卡花费的银子,仅低于当年的日本进口榧木棋墩。顺丰的包裹上贴了三个安检的标,也能看得出现在是特殊时期。打开包装后抑制住激动的心情拿出显卡,九成新是没有问题,但使用多久真是不好说,因为显卡的味道已经没有了。显卡比想象要大一些,与拆下来的1030相比要大上一大号,毕竟那个显卡是无需供电的。把显卡插在19年底组装的机器上,运行正常,原先最担心的400W电源,并没有拖后腿。12G显存消灭了瓶颈,可以顺利运行前期安装的程序,唯一遗憾就是因为tensorrt版本问题,显卡并未发挥威力。而随后安装的几个AI应用,也出现了版本问题。其中cuda尤为甚,NVIDIA在强推12新版本,而原先很多程序还停留在10、11,这种混乱显然还会持续很长时间。

咬牙购买二手拆机3060显卡

昨天晚上临睡前,趁着身体疲惫头脑不清醒,咬咬牙、狠狠心、一跺脚把前几天收藏夹里的惠普拆机九成新itx3060显卡下单了。
看重的这款显卡一是便宜,要比全新少花千数块钱呢;再者就是现在开始少见的12G显存,运行AI程序不受限;最后就是itx板型,适合多种机箱。
早上起来,感觉还是有些冲动了。
又浏览了网页平复心情,店铺里面居然有P104计算卡,而且价格不足400元,这可是前两年价格被炒上天的稀罕古董。
看来挖矿潮真的过去了。
下一个可能就是AI本地应用潮,该花的钱总要花的。

AI应用环境搭建完毕,只待显卡

今天在外忙了一天,回家简单做饭的同时,开始了继续昨天未完成的AI应用环境搭建。

通过本周Vits的应用,发现无论是国外的COLAB还是国内的GPU云服务器,都有诸多限制,要想常规学习应用,搭建本地环境还是必需的。

还好,在解决了几个昨晚遗留问题后,虽然vits训练未果,但系统环境搭建完成,不用再连续熬夜了。

在2019年底,为了人体体态识别应用,曾购买了一台二手Dell工作站,加上全新索泰矿卡P106-90,搭建了一台“深度”学习机器。跟昨天情况相同,也是颇费周折搭建环境完成后,运行程序硬件报错,只不过那次报错的4G内存不足,添加8G内存开始正常运行。

那台机器在搭建完成后不久,就因疫情而被遗落,几经周折,如同丢失的孩子,找回的希望几乎破灭,这也是我不得不重新搭建新机器的原因。

这次测试机器使用的外甥原先的游戏机,只是运行报错的硬件不再是内存,而是970显卡的4G显存。

三年过去,AI技术突飞猛进,硬件需求自然是水涨船高。而后期Stable-DiffusionAI绘图等应用,8G显存已经是最低要求。

看来,必须要先买一块二手RTX3060显卡了。

ChatGPT崛起,英伟达拒绝降价

前天几个人一起聊ChatGPT的时候,我做了一个预测,那就是这几年内,ChatGPT技术就会开源。

这些年来火遍全球的科技技术、项目后面,都是资本在兴风作浪,或者说是作妖,而推波助澜的也离不开那些传统的科技公司,甚至可以说是为虎作伥。

最近的例子就是虚拟货币,英伟达赚的是盆满钵满。而矿难之后,黄厂长刚放下身段要搞促销,ChatGPT的横空出世,顿时让老黄又鼻孔朝天了。

现在IT界掌门们都在敲打后辈:ChatGPT烧钱,尔等不要跟进。

后辈也不傻,都是吓大的,不烧钱能混IT?

要烧钱,最开心的还是那些资本,还有就是黄厂长他们了。虽说ChatGPT需要积累,但有了ChatGPT,数据的获取效率可谓是一日千里,缺少的就是数据处理。

而数据处理,怎么离得开黄厂长?

降价?黄厂长的刀快着呢。

折腾VITS个性化声线

昨天中午发现一个VITS代码库,可以根据个人的语音文件,通过训练生成个性化的声线。

因为在多语言情况下环境依赖难配置,那个项目是使用Colab运行的。自从有了国内的GPU云后,我已经很久没有使用Colab了,但看说明并不难,回去饭都没吃就开工,没想到一直到了第二天快两点也没有完工。

其实本来还算顺利,在解决了几个细节问题后,本已经进入最后的训练阶段,但就在进行到90%时,系统突然报错断开,仔细一看,原来是免费的GPU算力用尽。

前功尽弃,这免费的资本主义羊毛也不是这么容易薅的。

其实我也有心理准备,我最终目的就是转到国内的GPU云服务器上,但百度现在只提供飞桨框架,而最常用的恒源云最后阶段总是卡在路径参数上。毕竟这个系统是基于Colab的。

熬夜没有等着colab新的算力到账,早上起来打开电脑,依然无法使用,想付费人家只认美国信用卡。

好在到单位用他人账号登录Colab,有了昨天的经验,顺利完成了训练,效果尚能接受。毕竟训练使用的只是一个样本文件,如果使用大量语音文件进行训练,效果应该还会提升。

ChatGPT的成本

今天看新闻,谷歌在大倒苦水,说现在ChatGPT类产品的成本要大大高于传统的搜索。感觉这有点吃不到葡萄说葡萄酸的酸酸味道。
成本还分有效成本和无效成本之分呢。
在谷歌之前,是以雅虎为代表的目录式的搜索引擎,找到什么内容完全看供应商的勤快程度。后来谷歌等爬虫式的搜索引擎,基本上是广撒网良莠兼收,同时根据用户访问量进行整理排序。
后来都学坏了,也不知是国内外谁跟谁学坏的,也开始干预,甚至到了吃相难看的地步。
而到了现在的ChatGPT,则等是用户把内容推送上门,或者帮助系统整理归类,这等好事,原先是需要累死多少爬虫啊。
如果现在再把ChatGPT当做搜索引擎,或者整合到搜索引擎中,就有点像前段时间某学者怒斥知网一样:用了我的文章,还向我收费。

短视的业务整合

今天看新闻,百度掌门终于亲自为自家类ChatGPT产品文心一言站台了。

虽然根据之前百度的一贯作风,并不意外百度的小家子气,但看到百度要将文心一言与搜索业务整合,还是没有想到他会如此短视。

百度的没落源自搜索业务的没落,而随着ChatGPT的横空出世,受到冲击最为剧烈的就是搜索引擎。而百度偏偏要用自己难得拿得出手,甚至可以藉以东山再起的文心一言,与日薄西山的搜索整合。

这就像一个破落八旗子弟,家里发现家里箱底有件值钱黄马褂,却非要把新衣服裁了补旧袍子。

何况把ChatGPT整合到bing中的那位刚栽了跟头,好歹人家更有钱,买的还是干儿子,榨干一点是一点。

而百度,这两个可是亲儿子,非要让不肖子拖累死麒麟儿才罢休啊。

ChatGPT小说创作火候还远

近几日跟ChatGPT的交流,主要是基于小说的创作,这方面显然ChatGPT没有网上吹嘘的那么神乎其神。

关于写作,网上评论的AI缺少想象力不是原因,而是结果。这除了受限于AI的数据集,更主要的是AI无论中外,都是受限于内容审核,就像戴着镣铐起舞,像《水浒》这样的小说,根本不可能续写或者再创作。

即便是创作洁本,AI也时不时闹笑话,因为我构思的是架空小说,今天又来了一个曹操反清复明令人瞠目结舌的组合。

如果说AI参与小说创作,那也主要用来注水,而现在小说这种注水本来就不少,AI捉刀,倒也合适。