之前测试rag,我使用的材料是《三国演义》的文本文件,即便是deepseek推出后,效果仍然不是非常满意。
这几天分析,除了《三国演义》本身是文言白话混杂的作品,给AI的分词、理解提高了难度。还有一个重要原因,那就是《三国演义》太有名了,AI在训练过程中,难免被污染,所以才会在出现“关公骂王朗”的“本能性”回答的笑话。
于是决定改变一下案例,使用真正私有的文件,也就是对AI全新的资料进行回答。
敝帚自珍,这次选择的资料库是我完成许久的小说。从简书按章节导出后修改为升序文件名,以目录的方式导入知识库。
指定知识库后,使用deepseek-r提问,从分析到回答,已经不再夹带私货,完全按照原作进行回答,但理解能力还是有问题。
总结一下,应该是我虽然修改了文件名,但AI读取文件时,并未按小说的时间线进行分析。
多文件不行,就把多文件生成一个markdown文件让AI理解。在AI的辅助下,编写了一个程序,将多个网页中的内容采集后合并到一个文件中。
这次,AI给出了优异的答案,理清了人物关系,并在此基础上进行了人物情感分析。
这次使用的模型是硅基流动的,相比其他运营商“Token大赠送”的扭扭捏捏,硅基流动赠送的直接是免费券,而且界面简单明了。满意之余,顺手充值了10块钱,以作奖励。
回想一下,两周过去了,能够费脑子写新代码,这事情算是真的过去了。
标签: MySQL
初设MySQL5.7用户
早上起来给笔记本安装必要的软件,Python以及django安装顺利,反倒是最为熟悉的MySQL出了点状况。
安装的时候就觉得哪里有点不对劲,等到登录的时候才发现是原先默认的root用户没有设置密码,这样自然无法登录。
Ubuntu18.4默认安装的是MySQL5.7,和以往安装的5.5不同,用户及密码机制更新,需要首先通过操作系统的超级用户登录MySQL,然后进行root密码的修改。
这样也好,减少权限总要安全一些。
登录MySQL后,用户新建及授权倒没有变化,新建并授权用户后,通过MySQL自己图形客户端的MySQL workbench可以登录上去了,只是全英文。
装完突然想起,本来是想安装尝试MariaDB的,怎么又装成MySQL,一晚上了,脑子还是没有清醒过来。
恼人的Mysql编码
昨晚折腾半天,游戏也没有玩成,总结一下,也算没有白忙:
1.什么年代了还有高大上的单位用默认latin1编码,以后导数据前先看编码。
2.失去管理权限,Mysql盗库如此轻松。
3.看来Mysql已经成为商用的主流产品,除了少数客户端外,主流客户端都已经收费。
4.综合而言,Navicat是功能最全的,免费的Heidisql功能足够强,但编码上是一个短板。
5.最后一点,微软的产品依然是烂,难怪宁可被重罚,依然不放弃捆绑垄断。