数据污染的例子

周末在整理优化程序的时候,又被开源大模型给雷到了。
因为获取原始数据中,比较头疼的是日期格式错误,之前自己编写程序校验,这次交给几个大模型写代码,结果跟上次一样,几个新大模型给出同样的答案,而且错的极其离谱。
上次好歹只是得不到准确答案而已,这次好家伙,函数里面直接出现了空白字符。
这就跟小时候老师说的:你抄也找个好学生抄啊。
最后是原始模型llama3出面解决了问题。他给的答案是非常官方化,也就是最为简化,具体使用起来,还需要进行数据预处理。这就是那几个不肖徒子徒孙,在迭代训练中中,不知抄了哪个论坛里面转了不知多少遍的帖子。
这就是AI时代数据污染的一个例子。

debian7.5安装java环境及openfire

安装完毕ejabberd之后,总感觉不是很满意,于是今天试着安装目前最为流行的XMPP服务器openfire。

openfire需要java环境,为了不破坏现在的系统,于是在原先的debian7.5虚拟机上进行测试安装。开始设置PPA(personal package archieve)WEBUPD8的时候出现了点问题,这个需要

add-apt-repository ppa:webupd8team/java后添加:

deb http://ppa.launchpad.net/webupd8team/java/Ubuntu trusty main

deb-src http://ppa.launchpad.net/webupd8team/java/ubuntu precise main

到source.list文件中并update后

apt-get install oracle-java8-installer,这样java环境就安装好了。创建mysql数据库并用户授权之后,下载openfire最新的deb文件执行
dpkg -i openfire_3.7.1_all.deb进行安装,速度快的有些以为出错了,但是登录9090端口的web管理页面,发现确实是成功了。
进入管理页面,发现无论是安全性还是用户设置的确是比ejabberd强不少,下一步再进行测试吧。

参考: 一步一步在ubuntu上安装即时通讯服务器-Openfire – ghwghw – 博客园