关于高考,ChatGPT不靠谱

最近关于学生最热的莫过于考研成绩查询,其次是高一学生选课,已经远远高于四六级分数查询。

早上测试了一下ChatGPT,询问山东高一学生选课的建议。

不出所料,基本回答就是错误的,因为这与国内外关系不大,最主要的原因还在于ChatGPT的数据还是截止到2021年。此外就是,更多建议存在于所谓咨询机构的PPT上,公众讨论的还是稀少。

不过,ChatGPT的套话还是值得参考的,我最为赞同的是那就是对学习压力较大的科目进行减负,选择其他科目进行备考。

最后突发奇想,免费的ChatGPT是不是在装傻卖呆啊?

ChatGPT的热度似乎在降低

这几日ChatGPT的热度降低的有点极速,除了微软的bing这位急于求成的猪队友,还因为国内本来想跟风的几位,冷静下来发现,这类ChatGPT除了技术、数据的积累,光硬件能烧的起的也就有云服务业务的那几位。
即便走在前面的百度,也是少有的低调,在宣布文心一言三月推出后,少有进一步的跟进宣传。唯一官方靠谱的新闻,就是确定文心一言将通过百度智能云对外提供服务。
这与我最初的预计差不多,因为百度的各项AI服务,如我常用的OCR、文字语音服务等,都是通过这种形式。
这样也好,用户可以通过api各取所需,或直接使用,或嵌入到自己的业务中,同时收费也更有弹性。

需要注重交互性的ChatGPT

最近关于ChatGPT的负面新闻越来越多,什么系统要毁灭人类,什么系统嘴硬抬杠,更有甚者,说系统爱上自己挑唆离婚的。
都什么乱七八糟的。
这些内容多是标题党,内容不过是断章取义,或者道听途说。
而那所谓系统爱上自己的,要么是发帖人自恋到家的,要么就是聊着聊着,系统调用了狗血网文了。
与ChatGPT交流,关键是提问前要交代好背景,让系统了解问答范围,然后注意根据前文言简意赅的提出问题,限定想要的内容。
至少我感觉系统能做到“冠冕堂皇”这一步,已经很不错了。

已经可以交流的ChatGPT

因故返京计划推迟,这几天早上起床后调试一个小时的ChatGPT。
每天一个小时一是因为家里需要抢机器,更主要原因是免费版的ChatGPT如果一个小时连接次数过多,也就是问的问题太多,就会停止服务。
最近测试是基于一篇构思很久的小说。开始系统对录入的内容有些不知所云,但随着交流的深入——根据系统的反馈来看,真的可以称得上交流,系统虽然时不时来个关公战秦琼,但已经可以自行“编写”情节,甚至提前来个结局,并进行深刻的总结。
而且这种交流,系统会随时调用它的数据,并总结我们以往交流的内容,不单单只是话赶话而已。
多年前我写过一篇关于亚马逊服务的拟人短文,想象服务器为每个用户分设一台虚拟机,进行针对性的服务。
现在看来,ChatGPT已经实现了这个功能,只不过基于的是每个用户的数据集,这样更加高效。

公司文化即公司道德

在张朝阳与周鸿祎畅谈ChatGPT文章的末尾,张朝阳再三强调,比技术更重要的是道德。
我不由想到网上那句:你和他讲文化,他和你讲孔子;你和他讲孔子,他和你讲老子;你和他讲老子,他给你装孙子。
同样,技术落后,就占领道德制高点。
不知道张朝阳是阿Q精神,还是说给他旁边那位听的。
张朝阳虽然时不时一些“几小时睡眠”的奇思怪论,但好歹未有什么恶闻缠身。但如果360推出类ChatGPT产品,我是绝不敢用的。
当年360卫士大火的时代,单位机器里面几乎每台机器都安装了此产品。那时候机器尚能通过统一代理服务器访问固定的网站。一次一个同事向我求助,从B/S系统下载报表的时候,浏览器总是报错,提示无法访问网站。
经过多次测试都确认报表系统没有问题,后来在进行跟踪查询的时候才发现,原来是安装的360客户端想把那个文件上传到他们的服务器上去。而之所以传输这个文件,是因为文件名“高大上”。
企业文化其实就是企业道德,一个信奉如此文化的企业,毫无道德可言。

边缘的IT人,边缘的搜索

ChatGPT大火后,国内IT圈自然不会闲着,能上手的就上上手,不能上手的就蹭热度。搜狐张朝阳与周鸿祎两个已经被边缘化的人物,就展开对话指点江山。
张朝阳提到,ChatGPT的产生是从量变到质变的长期积累过程,是20年人们晚上积累信息,是原始AI使用的基础。
但他在谈到当下中文互联网信息环境时,就有些信口开河了。他认为中国网民沉浸APP信息流,使用搜索引擎比例降低,从而导致中文互联网搜索出的信息往往比较匮乏。
中文互联网搜索信息匮乏,跟网民搜索低有什么关系?
那只是因为搜索引擎方根本无心进行网络信息,尤其是高质量、新兴知识方面的搜索、积累,因为有诸如百科、知乎等自家的一亩三分地,生生把互联网搜索变成了局域网,而更大精力放在广告投放上了。
至于周鸿祎,估计一方面看着大规模投入眼红,一方面也应该后悔自己在搜索上浅尝而止吧。

网络新时代真的要开始了

注册ChatGPT后一个朋友想了解一下其回答情况,于是给了两个内容相似度极高,却表述不同涉及心理健康咨询的问题。

录入问题过了半分钟后,系统开始回答。我使用的网络状况一般,看着答案如打字般一个字一个字的显示在屏幕上,我真的感觉到后背发凉。

由于两个问题问法不同,所以答案侧重点也是不同。我无法从专业知识上进行评价,但那格式如公文规范一样的答案,至少是条理清晰,还带有人情味。糊弄我是一点问题没有的。

平静一下心情,又测试了一下小说写作。系统可以根据故事背景进行总结,并按照要求写出相应的文字。但如果不进行人工干预,文章结尾一般都如小学范文那样“认识到了……”、“过上了……生活”,显然这是套用了模板。

但如果系统根据他们的回答与我们的纠正,进行回锅处理,这比单纯爬虫搜索那些你抄我抄互相抄、重复又重复的网页,效率可以差之千里了。

网络新时代真的要开始了。

百度ChatGPT进展超想像

比我想象的还要快一些。
不过结合百度搜索来看,政策性限制对ChatGPT的影响会更大,这个不是单纯靠限制敏感字、词就能绕开的。
不知会不会出现因为敏感字、避讳语导致系统死机?
而国内受影响最大的公司,莫过于知乎了。

百度类ChatGPT产品“文心一言”公开:股价应声上涨13%-快科技-科技改变生活

AI聊天,百度绝地反击的良机

这几天chatGPT大火,昨天晚上本来也动了注册尝试的念头,但看了看注册的曲折路线流程,还是消了念头。
消了念头并非作罢,只是感觉国内很快就能跟进,而跟进者应该是百度。
今天早上就看到了这篇文章,从其专业角度看,跟进的步伐应该比我想的还要快。
对百度在AI方面有信心,不是因为这几年一直免费使用他的AI产品才为他说好话,而是因为只有百度能够提供免费便捷的服务,只是其他几大巨头根本不舍得、也拿不出相应的免费服务。如果不是挖坑作妖,没准我们现在还能使用百度的免费GPU服务器运行围棋AI呢。
对BAT已成往事的百度而言,这真是绝地反击的良机。
虽然对除去AI业务的百度,或者说早期的百度一向素无好感,但还是希望他这次能如孟子所写:入则无法家拂士,出则无敌国外患者,国恒亡。然后知生于忧患而死于安乐也。

https://www.sohu.com/a/636455154_121281830

katago1.12版本简要说明

katago于1月6日发布了1.12.0版本,增加了对新的和改进的神经网络架构的支持,同时附带了一个18B权重。

虽然此18B权重名称与之前网上流行权重名称相同,但如果只更新官方katago程序,运行时会报错,需要同时更新18B权重b18c384nbt-uec.bin.gz。

其后几天,katago官网连续发布了1.12.1与1.12.2两个版本,主要是1.12的bug修正。

相比1.12.1,1.12.2变动更大,重点是修正了之前18B广为诟病的调用时间过长的问题。但对系统要求也与原先不同,主要是TensorRT版本由TensorRT 8.2升级到了TensorRT 8.5。

如果我租用恒源云、AutoDL的GPU服务器,其目前版本为TensorRT 8.4,所以无法正常运行katago1.12.2。

如果使用其他云服务,可以在python下查看tensorrt版本号:

import tensorrt

print(tensorrt__version__)

如果版本号低于8.5,可以使用python命令尝试进行升级:

python3 -m pipinstall–upgrade setuptools pip

python3 -m pipinstallnvidia-pyindex

python3 -m pipinstall–upgrade nvidia-tensorrt