近期RAG心得总结

昨天躺下后,一时睡不着,脑子里又结合近来的学习,把那个关于MCP视频过了一遍,算是一个总结。
视频中是认为MCP是为了解决RAG的功能缺陷的,它主要的缺陷通过最近实验检测,发现是难以通过自身升级解决的。
一是RAG中资料是平铺,离散的,缺少关联,更没有顺序,这就如此前所说,根本不适合小说类资料。
二是RAG过于依赖向量数据库,而资料在导入数据时,是通过内嵌大模型进行切片的,而资料被切片属于无差别分割,虽有重合设置,但难以保证数据完整性、关联性。
三是RAG中各资料库间缺少关联,合则繁冗,分则无序。
最后,就如UP主推荐的数据库替代方案所承认的缺陷那样,太耗费大模型的tokens了。
最终解决方案,还是以大模型为主,资料库为辅,甚至可以说,就是让资料库为大模型服务。

Leave a Reply

您的邮箱地址不会被公开。 必填项已用 * 标注

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>